音视频技术开发周刊 66期( 二 )


一种全景视频的主观质量评价方法
与传统的2D视频不同,在头戴式设备的帮助下,全景视频提供一个球面的观察方向,这样提高了沉浸式和交互式的视觉体验 。但就我们所知,针对全景视频的主观质量评价方法很少 。因此,我们在这篇文章中提出了一个评估失真全景视频质量的主观方法 。
编解码
的介绍与使用
是强大的媒体文件转换工具,常用于转码,可选命令非常多,编码器、视频时长、帧率、分辨率、像素格式、采样格式、码率、裁剪选项、声道数等等都可以自由选择 。
基于编码应用的主观全景视频质量评价数据库
随着虚拟现实技术的发展,需要更高质量的全景视频来保证沉浸式的观看体验 。因此,质量评价对于相关技术非常重要 。考虑到投影时的几何变化以及头戴式设备(HMD)分辨率的限制,我们提出了一个针对主观测试的高质量序列的播放策略,即基于屏幕和人眼之间几何约束找出最佳播放分辨率 。
利用进行MP4视频转YUV格式
YUV主要用于优化彩色视频信号的传输,相比RGBA色彩来说,YUV格式占用更少的内存 。现在绝大多数视频解码后播放的格式都是YUV ,本文介绍如何利用将MP4视频转换为YUV格式 。
对采集到摄像头视频和麦克风音频裸码封装

音视频技术开发周刊 66期

文章插图
中对文件的输入和输出用一个结构体来指定,其中指定的是输入,指定的是输出,输出格式用函数来查找指定格式 。
AI智能
深入浅出聚类算法
聚类问题是机器学习中无监督学习的典型代表,在数据分析、模式识别的很多实际问题 中得到了应用 。在本文中,SIGAI 将为大家深入浅出的介绍聚类问题的定义以及各种典型的 聚类算法,帮助大家建立对聚类算法最直观、本质的概念 。
OCR大突破:推出大规模图像文字检测识别系统——
OCR(),也称光学字符识别,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入的一种技术 。
ECCV 2018 | 旷视科技提出:通过学习局部单应变换实现人脸校正
全球计算机视觉三大顶会之一 ECCV 2018(on)即将于 9 月 8 -14 日在德国慕尼黑拉开帷幕,旷视科技有多篇论文被此大会接收 。在这篇论文中,旷视科技提出的一种通过学习局部单应变换实现人脸校正的全新方法—— 。
ECCV 2018 | 建模任务相关注视点转移,实现第一人称视频注视点的准确估计
准确估计第一人称视频中人的注视点能够帮助计算机更好地预测人的关注区域,对于计算机自动理解人的动作和人与人之间的交互行为具有重要意义 。近日,来自东京大学和湖南大学的研究者们提出了一个全新的视角和方法对这一问题进行建模,新的方法在第一人称视频的注视点估计任务上大大超出了已有方法的性能 。
ECCV 2018 | 给Cycle-GAN加上时间约束,CMU等提出新型视频转换方法-GAN
CMU 和的研究者联合进行的一项研究提出了一种新型无监督视频重定向方法 -GAN,该方法结合了时间信息和空间信息,可实现跨域转换,同时保留目标域的风格 。相较于只关注空间信息的Cycle-GAN,在视频转换中-GAN的过渡效果更加自然 。
图像
美颜重磅技术之源码分析
说到基于GPU的图像处理和实时滤镜,大家肯定会想到鼎鼎大名的,这个项目确实为后续开发提供了很多方便,基本的图像处理工具一应俱全 。但是学习借鉴的项目结构,可以为我们提供不小的帮助 。