视频音频标准化组织

视频音频的很多协议都是由标准化组织牵头设计与规范的,其中,比较知名的有以下组织:

  • 国际标准化组织(International Standardization Organization,ISO)
    全球最大的国际标准化组织,负责了许多音视频相关协议的起草与制定。

  • 国际电工委员会(International Electrotechnical Commission,IEC)
    世界上成立最早的国际性电工标准化机构,负责有关电气工程和电子工程领域中的国际标准化工作。

  • 动态图像专家组(Moving Picture Experts Group,MPEG)
    ISO 与 IEC 下属的针对运动图像与语音压缩制定国际标准的组织。

  • 互联网工程任务组(Internet Engineering Task Force,IETF)
    全球互联网技术标准化组,负责了多数网络相关协议的制定。

  • 第三代合作伙伴项目计划(3rd Generation Partnership Project,3GPP)
    3GPP 是由一组电信合作伙伴建立的、成立于1998年12月的标准化组织或机构,其成员包括欧洲 ETSI 、日本 ARIB 和 TTC 、中国 CCSA 、韩国 TTA 和北美 ATIS 。其目标是在 ITU 的 IMT-2000 计划范围内制订和实现全球性的第三代移动通信电话系统技术规范和宽带标准,致力于 GSM 到 UMTS(WCDMA)的演进。

  • 国际电信联盟(International Telecommunication Union,ITU)
    国际电联是主管信息通信技术事务的联合国机构,负责分配和管理全球无线电频谱与卫星轨道资源,制定全球电信标准,向发展中国家提供电信援助,促进全球电信发展。

  • 数字电影联盟(Digital Cinema Initiatives,DCI)
    DCI 成立于2002年3月,是迪斯尼(Disney)、派拉蒙(Paramount)、索尼影业娱乐(Sony Pictures Entertainment)、环球影业(Universal)和华纳兄弟影业(Warner Bros. Studios)的合资企业。DCI 的主要目的是建立和记录数字电影开放式架构的自愿规范,以确保统一和高水平的技术性能、可靠性和质量控制。

  • 美国电影电视工程师协会(The Society Of Motion Picture And Television Engineers,SMPTE)
    电影电视工程师协会是美国的一个国际性组织,它成立于1916年,最初名称为电影工程师协会,1950年后改为现名。该组织制定了多项电影、电视行业的标准,在电影制作、电视制作、数字影院系统、医学影像及声音等领域共制定了超过400项标准。

视频文件类型

mp4

MP4(Moving Picture Experts Group 4)格式是指采用了 MPEG-4 Part 14 标准的视频文件格式。MPEG-4 是一套用于音频、视频信息的压缩编码标准,由 MPEG 制定,第一版在1998年10月通过,第二版在1999年12月通过。MPEG-4 格式的主要用途在于网络传输、光盘、语音发送(视频电话),以及电视广播。

mkv

Matroska 视频(Matroska Video,MKV)格式是一种开放标准的开源的多媒体容器文件格式。MKV 格式允许在一个文件中容纳无限数量的视频、音频、图片或字幕轨道。其目标是作为一种统一格式保存常见的电影、电视节目等多媒体内容。其在技术规程上完全开放,在实现上包含了很多开源软件。

webm

WEBM 是一个开放免费的媒体文件格式,由 Google 公司提出,以 Matroska 容器格式为基础开发的新容器格式,以 VP8 格式进行视频编码,以 Ogg Vorbis 格式进行音频编码。

avi

音频视频交错格式(Audio Video Interleaved,AVI)是 Microsoft 公司于1992年11月推出、作为其 Windows 视频软件一部分的一种多媒体容器格式。AVI 文件将音频和视频数据包含在一个文件容器中,允许音视频同步播放。

wmv

视窗媒体视频(Windows Media Video,WMV)是 Microsoft 开发的一系列视频编解码和其相关的视频编码格式的统称,是微软视窗媒体(Microsoft Windows Media)框架的一部分。

asf

高级串流格式(Advanced Streaming Format,ASF)是 Microsoft 为 Windows 98 所开发的串流多媒体文件格式。利用 ASF 文件可以实现点播功能、直播功能以及远程教育,具有本地或网络回放、可扩充的媒体类型等优点。

ts/m2ts

传输流(Transport Stream,TS)是一种多媒体封装格式,它的全称为 MPEG2-TS 。MPEG2-TS 是一种标准数据容器格式,传输与存储音视频、节目与系统信息协议数据,主要应用于数字广播系统,譬如 DVB、ATSC 与 IPTV。传输流最初是为广播而设计的,后来,通过在标准的188字节数据包中添加4字节的时间码(TC),从而使该数据包成为192字节的数据包,使其适用于数码摄像机,录像机和播放器,扩展后的 TS 使用 m2ts 文件后缀,常见于 Blu-ray 光盘文件。

vob

VOB(Video Object)是 DVD 视频媒体使用的容器格式,VOB 将数字视频、数字音频、字幕、DVD菜单和导航等多种内容复用在一个流格式中。

mpeg/mpg

MPEG(Moving Picture Experts Group,MPEG)是采用了 MPEG 标准的多媒体文件格式。MPEG 标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7 及 MPEG-21 。MPEG 标准的视频压缩编码技术主要利用了具有 运动补偿 的帧间压缩编码技术以减小时间冗余度,利用 离散余弦变换(Discrete Cosine Transform,DCT)技术以减小图像的空间冗余度,利用 熵编码 则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了视频压缩性能。

rm

RM(Real Media)格式是 Real Networks 公司开发的一种流媒体视频文件格式,可以根据网络数据传输的不同速率制定不同的压缩比率,从而实现低速率的网络上进行视频文件的实时传送和播放。

rmvb

Real Media 可变比特率(Real Media Variable Bit Rate,RMVB)格式是 Real Networks 公司开发的 Real Media 多媒体数字容器格式的可变比特率(Variable Bit Rate,VBR)扩展版本。相对于更常见的按固定比特率(Constant Bit Rate,CBR)编码的流媒体 Real Media 容器,RMVB 典型应用于保存在本地的多媒体内容。

3gp

3GP 格式是 3GPP 为 3G UMTS 多媒体服务定义的一种多媒体容器格式,主要应用于3G移动电话,是一种 MPEG-4 Part14(MP4)格式的简化版本。

mov

MOV 格式即 QuickTime 封装格式(也叫影片格式),它是 Apple 公司开发的一种音频、视频文件封装格式,用于存储常用数字媒体类型。MOV 格式是 QuickTime Player 的默认格式。

m4v

M4V 格式是一种应用于网络视频点播网站和移动手持设备的多媒体格式,是 MP4 格式的一种特殊类型,其视频编码采用 H.264,音频编码采用 AAC。

M4V 格式由 Apple 公司开发,基于 MPEG-4 编码第二版。此种格式为 iPod 、 iPhone 和 PlayStation Portable 所使用。

flv

FLV(Flash Video)流媒体格式是 Sorenson Media 公司开发的一种视频格式。它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不能在网络上很好的使用等缺点。FLV 流媒体格式是随着 Flash MX 的推出发展而来的视频格式。

音频文件类型

mp3

动态影像专家压缩标准音频层面3(Moving Picture Experts Group 1 Audio Layer III,MP3)是计算机、手机、MP3设备、随身数码设备(iPod)等常用的音频文件格式。MP3 是一种音频压缩技术,使用此格式来存储的音频文件,可以大幅度地降低音频数据量,并提供了较好的音质效果。

MP3 格式是一种有埙的音频压缩(文件编码)格式,但是它的优点是,文件容量较小,方便存储携带传播,尤其是网络收听,或者存储在手机,用来播放音乐。

wma

视窗媒体音频(Windows Media Audio,WMA)是 Microsoft 公司推出的一种音频文件格式。WMA 在压缩比和音质方面都有着出色的表现,可以媲美 MP3 文件,在较低的采样频率下也能产生较好的音质。WMA 也属于有损的音频文件压缩格式,但是因为其文件占用磁盘空间少,较为方便移动存储和传播。

aac

高级音频编码(Advanced Audio Coding,AAC)属于一种有埙压缩格式。与 MP3 不同的是,它采用了全新的算法进行编码,利用 AAC 编码,可使人感觉声音质量没有明显降低的前提下,文件更小。

ogg

Ogg(Ogg Vorbis)是一种有损的音频压缩格式。Ogg 是完全免费、开放和没有专利限制的,支持多声道。

midi

乐器数字接口(Musical Instrument Digital Interface,MIDI)是一种编曲类的音频格式文件。是编曲界最广泛的音乐标准格式,可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐,一首完整的 MIDI 音乐只有几 KB 或者几十 KB 大小,而能包含数十条音乐轨道。
我们听 MIDI 音乐的时候,它都是音乐(乐谱)的声音,而没有人声。它主要的作用是辅助音乐创作、乐曲演奏等。

ac3

杜比数码环绕声(Dolby Surround Audio Coding-3,AC3)是一种有损的音频文件格式,可以对6个比特率最高为448kbps的单独声道进行编码,由日本先锋公司与美国杜比实验室合作研制。也被称为5.1声道。

wav

WAV(WaveForm)是 Microsoft 公司专门为 Windows 开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。WAV 文件还原的波形曲线十分逼真,音质也非常好,但是 WAV 文件占用的磁空间非常的大。

flac

无损音频压缩编码(Free Lossless Audio Codec,FLAC)是一种无损失音频文件压缩格式,使用此编码的音频数据几乎没有任何信息损失。该文件占用空间较大,适合存储于计算机,或者大容量手机之中,适合音乐发烧友用户使用。

ape

APE 是数字音乐无损压缩格式之一,由软件 Monkey’s audio 压制得到。

字幕文件类型

srt

文本格式字幕(SubRip Text,SRT)是最为流行的字幕文件格式之一。其制作规范简单,仅需要一句时间代码加一句字幕,配合上 .style 文件还能让字幕自带一些字体上的特效等。

sub+idx

SUB 是一种图形格式字幕,由 idx 和 sub 文件组成,有时也能看到 ifo 文件。idx 相当于索引文件,里面包括了字幕出现的时间码和字幕显示属性等。sub 文件存放字幕本身。

ssa

SSA(Sub Station Alpha)是由 CSLow(又称 Kotus)创建的一种字幕格式,用以实现比传统字幕诸如 srt 等格式更为复杂的功能。

ass

ASS(Advanced Sub Station Alpha)是比 SSA 更高级的字幕脚本。技术上讲,他是 SSA v4+,比普通的 SSA 有更多的规范,可以生成更丰富的字幕内容。

vtt

Web 视频文本轨格式(WebVTT)是一种使用 <track> 元素显示定时文本轨道(例如字幕或者标题)的格式。WebVTT 文件的主要用途是将文本叠加到 <video> 中。WebVTT 是一种基于文本的格式,必须使用 UTF-8 进行编码。

其他相关文件类型

nfo

nfo(information)是相当普遍的 ASCII 文字档案的副档名,它的内容包含主要档案的相关文字说明资讯。可以使用文字编辑器或是 NFO 专用的浏览器浏览 NFO 档案的内容。档案的内容还会包含精心制作的 ASCII 艺术图案。

ifo

DVD 光盘中的 IFO(information)文件包含 DVD 播放器所需的 DVD 光盘的所有信息,这样用户可以导航播放正确的 DVD 内容。

bup

DVD 光盘中的 BUP(backup)文件是 IFO 文件的完整备份,用于容灾和灾备。

视频文件清晰度

电视广播制式

电视广播制式(television system)是指电视信号的标准,即用来实现电视图像或声音信号所采用的一种技术标准。
彩色电视机的制式一般只有三种,即 PAL、NTSC、SECAM。

  1. 正交平衡调幅制(National Television Systems Committee,NTSC)。采用这种制式的主要国家有美国、加拿大和日本等。这种制式的帧速率为29.97fps(帧/秒),每帧525行,标准分辨率为 720x480。
  2. 正交平衡调幅逐行倒相制(Phase Alternative Line,PAL)。中国、德国、英国、印度、巴基斯坦和其它一些西北欧国家采用这种制式。这种制式帧速率为25fps,每帧625行,标准分辨率为 720×576。
  3. 行轮换调频制(Séquentiel couleur à mémoire,SECAM)。采用这种制式的有法国、俄罗斯和东欧一些国家。这种制式帧速率为25fps,每帧625行,标准分辨率 720×576。

一般将 PAL 制式(分辨率 720x576,屏幕宽高比 4:3)或 NTSC 制式(分辨率 720x486,屏幕宽高比 4:3)的电视广播称为标准清晰度电视(Standard Definition TeleVision,SDTV),简称为标清或普清。

HDTV

高清晰度电视(High Definition Television,HDTV)根据 ITU 的定义,应是一个透明系统,一个正常视力的观众在距该系统显示屏高度的三倍距离上所看到的图像质量应具有观看原始景物或表演时所得到的印象。

HDTV 源于 数字电视(Digital Television,DTV)技术,与采用模拟信号传输的传统电视系统不同,HDTV 采用了数字信号传输。由于 HDTV 从电视节目的采集、制作到电视节目的传输,以及到用户终端的接收全部实现数字化,因此 HDTV 给我们带来了极高的清晰度。

根据各个国家使用电视制式的不同,各国家和地区定义的 HDTV 的标准分辨率也不尽相同。

在中国一般而言,HDTV 有三种显示格式,分别是:720p(1280×720分辨率,逐行扫描),1080i(1920×1080分辨率,交错式扫描),1080p(1920×1080分辨率,逐行扫描)。数字代表了垂直方向分辨率,扫描格式使用 p 或 i 来表示,p表示逐行扫描(progressive scan),i表示交错式扫描(interlaced scan)。同时,HDTV 的帧率达到了 60fps,屏幕宽高比变成了 16:9。

美国电影电视工程师协会确定的高清标准格式,受限制于存储介质(一部 1080p 的影片需要10GB以上的存储空间),目前 1080p 的影片多数以蓝光(Blu-ray)方式发行。

分辨率

分辨率又称为解析度,分辨率越高,像素越多,图像越清晰。

  • SD(Stardard Definition 标清/普清)
    分辨率为 720x576 或 720x486

  • 720p = HD(High Definition 高清)
    分辨率为 1280×720

  • 1080i = HD
    分辨率为 1920×1080

    HD 是指垂直分辨率大于等于 720 的图像或视频。

  • 1080p = HD / FHD(Full High Definition 全高清)
    1080p 为 HD 下的最高分辨率,又被称为全高清。分辨率为 1920×1080

  • 1440p(2K) = QHD(Quad High Definition 四倍HD)
    分辨率为 2560×1440

    2K 分辨率,指屏幕或者内容的水平分辨率达约2000像素的分辨率等级。DCI 定义的 2K 分辨率的标准为 2048×1080 ,数字影院放映机主要采用这种分辨率。

  • 2160p(4K) = UHD(Ultra High Definition 超高清)
    分辨率为 3840×2160

    UHD 是指垂直分辨率达到 2160 以上的图像或视频。

    DCI 定义的 4K 分辨率的标准为 4096×2160

  • 4320p(8K) = UHD
    分辨率为 7680×4320

片源

BD(Blu-ray Disc)蓝光光盘

WEB-DL(Web download)是从 WEB 页面获取到的一种高清视频,WEB-DL 的来源是 iTunes 在线商店以及 Netflix 等各大视频网站,质量要比 HDTV 好,较之0day的录制版信号源也更清晰,相比 HDTV,无水印,无台标logo,无插播广告,所以无任何剪切较完整,但是不如 BD 的清晰度。

HDTV(High Definition Television)高清晰度电视

DVD(Digital Video Disk)数字视频光盘

HDRip/HDTVRip 是用 DivX/XviD/x264 等 MPEG4 压缩技术对 HDTV 的视频图像进行高质量压缩,然后将视频、音频部分封装成一个 .avi.mkv 文件。实际上是对 HDTV 的2次压缩,将原来的 MPEG2、H264、AVC 或者 VC-1 编码重编码为 MPEG4 编码。

DVDRip 是 用 DVD 做为片源进行重新压缩编码的文件。一般使用 DivX、XviD 以及 x264 等MPEG4 压缩技术压缩视频,用 MP3 或 AC3 等压缩音频。

WEBRip 指的是至少经过一次转码的在线内容,包括使用有损抓取或录屏软件获得的内容,也包括基于 WEB-DL 的重编码。

视频元数据

码率

码率,又叫比特率,是指单位时间内传输的数据量,单位一般为kbps(千位每秒)。
根据码率是否是固定的可以将码率分为两种,恒定码率 与 动态码率。

恒定码率(Constant Bit Rate,CBR),码率稳定可控,带宽要求不高,图像变化量比较大时方块效应比较明显。恒定码率(kbps) = 文件大小(kb) * 8 / 时间(s)。

动态码率(Variable Bit Rate,VBR),码率波动较大,带宽要求较高,图像变化量比较大时方块效应有所改善。发生网络抖动时,比较容易丢包,需要重传,或者 FEC 前向纠错,从而带来延时。动态码率(kbps) = 每秒传输数据量(kb/s) * 8。

分辨率

参见 分辨率

帧率

视频帧率(Frames Per Second,FPS)为视频每秒传输的图片的量。每一帧都是静止的图象,由于人眼的视觉停留效果(人的大脑视觉处理中心,大约会将看到的画面在视觉里暂留100至400毫秒),快速连续地显示帧便形成了运动的假象。理论上,每秒十五帧以上即可使人看到连续的画面,高的帧率可以得到更流畅、更逼真的动作效果,但是更高的帧率也会带来存储上的问题。

史上第一部部分有声的电影《爵士歌手》在1927年上映,其最终成品在无声音片段时统一使用的是24帧,随着《爵士歌手》的成功,各大片厂便开始规定摄影师要遵守每秒24帧的速率。
2012 年 12 月 14 日上映的《霍比特人:意外之旅》预算1.8亿美元,在制作上《霍比特人:意外之旅》的每秒帧数达到了48帧,高制作的同时也因此获得了更震撼的画面感。
李安导演在2016年推出最高4K分辨率、120FPS及3D规格的电影——《比利·林恩的中场战事》,该片于2016年11月11日以120帧、60帧、24帧、3D规格在中国上映。

目前,绝大多数的数字电影拍摄帧率仍然是24fps,但更高帧率的电影也在不断涌现中。中国的电视广播制式是 PAL 制式,频率为 25fps。美国的电视广播制式是 NTSC 制式,频率为 30fps。

时长

视频所有图像播放所需要的时间称为视频时长。
时长(s) = 帧数 / 帧率(fps)

色域

指某种表色模式所能表达的颜色构成的范围区域,色域空间越大,所能表现的颜色越多。

SDR(Standard Dynamic Range): 标准动态范围,指一种很常见的色彩显示方式。
HDR(High Dynamic Range): 高动态范围,比普通数位图像技术更大曝光动态范围的一组技术。

HDR 标准
  • HDR10: 消费者技术协会(Consumer Technology Association,CTA)2015年8月27日宣布的开放标准,不需要支付任何版权费。这个标准要求必须使用宽色域 Rec.2020 色彩空间,10bit 色深,以及 SMPTE ST 2084(PQ)图像传输功能,但它的数据元全部是静态的,简单来说就是每一帧所输出的 HDR 图像效果是一样的。目前所有支持 4K HDR 的设备都必须达到这个标准
  • Dolby Vision HDR: 杜比视界 HDR 是由杜比实验室提出并定制的 HDR 当前最高级标准,与 HDR10 不同的是,它不是开放的标准,需要使用它必须交付一定的版权费用(据悉是每年每台设备3美元)。杜比视界要求必须使用宽色域 Rec.2020 色彩空间, SMPTE ST 2084(PQ)图像传输功能,与 HDR10 不同的是,它采用 12bit 色深,并且支持动态数据元结构,杜比视界允许 10000 尼特的最大亮度(目前在设备中最高只达到 4000 尼特)。
  • HDR10+: 于2017年4月20日由三星和亚马逊 Video 共同公布,由于杜比视界 HDR 极高的版权费用,三星等厂商不愿意支付,所以与松下、亚马逊和20世纪福斯创建了 HDR10 + 联盟,以推广HDR10 +标准。HDR10+ 通过添加动态元数据来更新 HDR10,动态元数据可用于在逐个场景或逐帧的基础上更精确地调整 HDR 的亮度级别,和杜比视界 HDR 类似,不过色深依旧是 10bit。
  • HLG(Hybrid Log-Gamma): HLG 是由 BBC 和 NHK 联合开发的 HDR 标准,它与标准动态范围(SDR)显示兼容,但它需要 10bit 色深。HLG 定义了非线性电光传递函数(EOTF),其中信号值的下半部分使用伽马曲线,信号值的上半部分使用对数曲线。HLG 标准免版税,与 SDR 显示兼容。HLG 由 HDMI 2.0b、HEVC、VP9 和 H.264 / MPEG-4 AVC 提供支持。HLG 主要应用于广播以及部分流媒体,如 BBC iPlayer、DirecTV、Freeview Play 和 YouTube。

视频音频编码

视频编码

视频编码方式就是指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。常见的视频编码格式有:

  • H.264
    H.264 是由 ITU-T 视频编码专家组与 MPEG 联合提出的高度压缩数字视频编解码器标准。这个标准也被称为 AVC(Advanced Video Coding),同时也是 MPEG4 标准的第十部分,参见 MPEG-4: Advanced Video Coding。H.264 是目前嵌入式和移动设备中采用最多的视频编解码算法标准。H.264 通常使用 x264 编码器进行编码。
  • H.265
    H.265 是 ITU-T 发布的基于 H.264 优化的新的视频编码标准。H.265 也被称为 HEVC(High Efficiency Video Coding),参见 H.265 : High efficiency video coding。通常使用x265 编码器进行编码。
  • VP8
    VP8 是一个开放的图像压缩标准,最早由 On2 Technologiesis 开发,随后由 Google 发布。同时 Google 也发布了 VP8 的编解码器 libvpx,以 BSD 授权条款的方式发布。VP8 是 Google 开发和推动的视频编解码标准,被 Chrome 很好的支持。VP8 目前是 WebRTC 的默认视频编解码标准,超过 90% 的 WebRTC 视频会话使用 VP8 来进行编解码。
  • VP9
    VP9 是 Google 提供的开源的免费视频编解码器,是VP8的后续版本。2012年底,VP9的解码器被加入 Chrome 浏览器。
  • M-JPEG(Motion-Join Photographic Experts Group)
    M-JPEG技术常用于闭合电路的电视摄像机的模拟视频信号转换成视频流,并存储在硬盘上。H.264的压缩比一般能达到 1:50 甚至 1:100 以上,而M-JPEG压缩比一般小于 1:20。但由于 M-JPEG 压缩率较小,所以能达到跟原图像接近的画质和清晰度。
  • VC-1(WMV3)
    WMV(Windows Media Video)是 Microsoft 开发的一组数字视频编解码格式。2003年 Microsoft 公司基于 Windows Media Video 第 9 版编解码起草了视频编解码规范并且提交给 SMPTE 申请作为标准。这个标准在2006年3月作为 SMPTE 421M 被正式批准,常被称为 VC-1。WMV1、WMV2、WMV3分别对应 Windows Media Player 的版本7、8和9,所以 VC-1 也会被称为 WMV3 或 WMV9(早期也被称为VC-9)。

音频编码

  • MP3
    MP3(Moving Picture Experts Group-1 Audio Layer 3)是当前最流行的有损音频压缩格式。MP3文件是由帧(frame)构成的,帧是MP3文件最小的组成单位。MPEG音频文件是MPEG1标准中的声音部分,也叫MPEG音频层,它根据压缩质量和编码复杂程度划分为三层,即 Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3这三种声音文件,并根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达10:1-12:1。
  • AAC
    AAC(Advanced Audio Coding)是一种专为声音数据设计的文件压缩格式。与MP3不同,它采用了全新的算法进行编码,更加高效,具有更高的“性价比”。利用AAC格式,可使人感觉声音质量没有明显降低的前提下,更加小巧。AAC格式广泛用于苹果设备和系统,AAC通常压缩比为18:1,是最高效的音频有损编码格式
  • AC-3
    1994年,日本先锋公司宣布与美国杜比实验室合作研制成功一种崭新的环绕声制式,并命名为“杜比AC-3”(Dolby Surround Audio Coding-3)。1997年初,杜比实验室正式将“杜比AC-3环绕声”改为“杜比数码环绕声”(Dolby Surround Digital),我们常称为Dolby Digital。
    AC3为有损编码格式,常见于DVD/BD,提供的环绕声系统由5个全频域声道和1个超低音声道组成,被称为5.1声道。码率最高为640k通常有640、448、384这几种码率。
  • DTS
    数码影院系统(Digital Theatre System,DTS)是1996年底推出的一种源自剧院模式开发的数码环绕声系统。DTS 系统不仅具有 AC-3 相似功能,更加强了其纵深定位交叉效果。DTS属于DVD时代的音频标杆,有损音频压缩格式, DTS 最高码率为 1536kbps,压缩传输比为 4:1。
  • DTS-HD Master Audio
    DTS-HD Master Audio是无损压缩音轨,DTS宣称它是“bit for bit”的完整再现录音母带效果,是完全无损压缩,在蓝光影碟中最高码率可达24.5Mbps。DTS HD内核也带有1.5Mbps码率的DTS 5.1音轨数据,因此也可以实现通过SPDIF传输到老功放实现5.1音频。
  • TRUE HD
    TRUE HD是杜比专为高清影碟开发的无损压缩音轨格式,最高可支持多达八个分离的24bit/96 kHz全频带声道,在蓝光影碟中的码率最高为18Mbps。杜比宣称TRUE HD为100%无损音频,因此除了比同规格LPCM更节省带宽外,还可以加入对白和整体音量控制,实现比如夜间影院功能,它的内核还带有一条640K码率的AC3 5.1音轨数据,即便整部影片只有TRUE HD音轨,对老功放通过光纤传输也可以实现5.1音效。
  • PCM / LPCM / FLAC
    PCM/LPCM常见于BD,是一种无损格式,不做压缩,类似wav。FLAC是最好用的音频无损压缩格式,编码器开源,在PC上兼容性好,压缩率优于DTS-HD MA和TrueHD,但是以上三种在高清电影中并不是很常见

其他音视频相关名词解释

TC(TELECINE)使用电视电影机从胶片直接数字拷贝,其图象和声音质量最好
Hi-Fi(High-Fidelity)高保真
CRT(Cathode Ray Tube)阴极射线显像管

视频播放器

多平台

  • QQ影音
    QQ影音是由 腾讯 公司开发的一款免费、无广告的基于 ffmpeg 的视频播放器。

  • 暴风影音
    暴风影音是北京暴风科技有限公司推出的一款视频播放器,该播放器兼容大多数的视频和音频格式。支持切换视频解码器和音频解码器。

  • Real Player
    Real Player 是由 Real Networks 公司开发的跨平台播放器。

Windows

  • Windows Media Player
    Windows Media Player 是 Microsoft 公司出品的一款免费的播放器,属于 Microsoft Windows 的一个组件,Windows 操作系统下默认的媒体播放器。

  • KMPlayer
    韩国人姜龙喜开发的一款视频播放器,由 Delphi 编写。

  • PotPlayer
    PotPlayer 是 Daum 公司的一款网络播放器,使用 VC++ 编写。

  • MPC-HC
    MPC-HC(Media Player Classic - Home Cinema)是一款轻量级的、开源的 Windows 操作系统下的媒体播放器。源代码地址 mpc-hc

MacOS

  • QuickTime Player
    Apple 公司出品的播放器,MacOS 操作系统下默认的媒体播放器。

  • IINA
    MacOS 操作系统下的一款开源媒体播放器。源代码地址 iina

Android/iOS

  • ijkplayer
    bilibili 开源的一款 Android/iOS 视频播放器,基于 FFmpeg。源代码地址 ijkplayer