当前位置:首页|资讯|斯坦福|ChatGPT

计算机视觉CS131 :1-引言

作者:千夜明发布时间:2023-03-28

本专辑背景

  • 目的:系统性整理和复习一下计算机视觉的基本原理和发展历程。

  • 行动:内容主要是斯坦福的CS131课程(CS131 Computer Vision: Foundations and Applications),北邮的鲁鹏有讲授该课程。但是,上述两个资料在自学过程中,还是遇到了很多疑问,所以,这个专栏笔记中,会加上自己额外搜集(包括部分chatGPT的解释)和整理的资料和理解作为补充。

  • 主要研究资料

  1. CS131官网:http://vision.stanford.edu/teaching/cs131_fall2223/

  2. 计算机视觉(本科) 北京邮电大学 鲁鹏:https://www.bilibili.com/video/BV1nz4y197Qv/

  3. chatGPT等对某专业术语的解释。

CS131课程的知识大纲如下:

开始正文:

本节知识点

  1. 计算机视觉起源

  2. 人类视觉系统

  3. 色彩物理学

  4. 图像在计算机中表示方法

  5. 颜色空间

1 计算机视觉起源:

计算机视觉的起源可以追溯到1966年麻省理工学院的本科暑期项目,当时人们认为计算机视觉可以在一个夏天解决。

2 人类视觉系统

人眼虽然能够迅速理解图像主题,但是容易忽视“不重要”的细节改变,比如如下两幅图,你能快速发现两者的差异吗?

此外,人眼容易产生错误的判定。如下,A和B区域的颜色看上去是不是“肯定”不一样?

实际上是一模一样:

3 色彩物理学

电磁波:

  • 从科学的角度来说,电磁波是能量的一种,属于一种波,就像机械波,引力波和物质波(概率波)一样,凡是高于绝对零度的物体,都会释出电磁波,且温度越高,放出的电磁波频率就越高,波长就越短,这种电磁波称之为黑体辐射。正像人们一直生活在空气中而眼睛却看不见空气一样,除光波外,人们也看不见无处不在的其他电磁波。

  • 电磁波如何产生的?

    • 基本粒子间带电粒子周围存在电场,运动的电场形成磁场,运动的磁场又转化为电场,互相转化的电磁场以光速向外传播,形成电磁波。

    • 比如:电子绕原子核高速旋转,就会辐射电磁波,就是光谱辐射。电子在电感电容回路中受变化电场作用而不停震荡,就会对外辐射无线电波。电子束撞击金属表面,就会产生X射线。以上的可见光谱、无线电波、X射线都是电磁波,都是电子运动状态发生变化造成的。更广泛的说,电磁波是空间位移电荷变化而产生的。

可见光:

  • 可见光(visible light)指的是电磁波的一部分。电磁波根据其波长不同可以划分为不同波段,一般而言波长在 380 ~ 700 nm 之间的波段被称为可见光,因为这一波段的电磁波可以被人类的眼睛以光的形式接收。不同人类个体接收可见光的波长范围可能略有差异,但基本上在上述波长范围附近。

为什么这一波段的电磁波能被人“看见”

  • 简单说,就是人眼中的视黄醛分子(一个维生素 A 分子氧化后得到),在可见光照射下,会导致视黄醛辅基从视蛋白上脱离,后续一系列反应产生神经电信号,通过视神经传入大脑,让我们产生了视觉。

什么是颜色?

  • 颜色是环境中物理光与我们视觉系统之间相互作用的结果。颜色不是光的物理属性。我们的视觉体验是心理属性。

4 图像在计算机中的表示方法

如下是图像的一种表示方法:左边是一张灰度图,右边是一个2维矩阵,二维矩阵的取值范围为[0, 255]中的整数,代表灰度值的强度。

如果要计算机屏幕显示一张彩色图像,那么根据光学成像原理,通过R,G,B三种颜色光叠加即可,所以,一张彩色图像可以用一个3维矩阵表示,如下:

每个通道中每个元素,单独表示某种颜色的亮度值

5 颜色空间

颜色空间:是用来描述和表示图像颜色的数学模型。在计算机视觉和数字图像处理中,颜色空间是非常重要的概念,因为它们允许我们将图像颜色转换为不同的表示形式,从而使图像处理更加灵活和有效。

颜色空间有很多种,举2个常用的颜色空间如下:

  • (1)RGB颜色空间:RGB是最常见的颜色空间之一,它使用红色、绿色和蓝色三个颜色通道来描述颜色。在这个空间中,每个像素由三个分量值来表示,分别代表红色、绿色和蓝色分量的亮度。

  • (2)HSV颜色空间:HSV颜色空间(色相、饱和度、亮度)使用色相、饱和度和亮度三个参数来描述颜色。Hue色调, Saturation饱和, Value明暗度,是根据颜色的直观特性由A. R. Smith在1978年创建的一种颜色空间。旨在反映更传统和直观的混色模型(例如油漆混合)。

    • 色调(H):色相表示颜色的基本色调。角度度量,取值范围为0°~360°。

    • 饱和度(S):饱和度表示颜色的纯度。通常取值范围为0%~100%,值越大,颜色越饱和。

    • 亮度(V):亮度表示颜色的亮度,通常取值范围为0%(黑)到100%(白)。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1