第一步开发者需明确:需应用在什么业务场景?核心实现什么能力?
音视频在各行各业的应用越来越广泛,成为互联网产品的标配。有大家熟知的消费互联网领域,近几年疫情带来的远程交流协作的需求,使实时音视频在产业互联网场景加速渗透。比如:远程交流、协作,企业数字化与工业数字化场景...
随着音视频技术迅速发展,除基础音视频能力外各大厂商推出多种新颖玩法。下面列举主流场景中所需的音视频能力要求,按基础、进阶、特色三个维度进行分类,便于开发者查阅。 社交娱乐场景
消费互联网领域是音视频技术渗透最广泛的场景,音视频功能成为社交娱乐产品的标配。
社交娱乐领域的场景含:语聊房、在线KTV、秀场直播、社交小游戏等,将社交娱乐所需功能分为:基础功能、进阶功能、特色功能。市面上的SDK基本都覆盖了基础功能,随着社交娱乐场景的发展,对互动/玩法上衍生了更多要求。如在线K歌场景需正版曲库,秀场直播场景更看重主播与用户之间的互动,实时消息,送礼物,VIP用户权益等。 产品功能功能描述业务场景基础功能音视频通话用户加入同一个房间,并进行音视频通话。1v1 视频通话、多人视频会议音视频直播同一个房间,包含主播及观众,主播可以进行音视频直播,该房间内的观众可以观看直播。秀场直播、游戏直播、电商直播进阶功能直播连麦一个房间内,可以出现多个主播,进行同屏连麦直播。多主播跨区连麦、多人 KTV合唱、多人连麦直播房间实时消息实时消息主要提供纯文本消息的收发功能,可向同一房间内的其他用户发送广播消息和弹幕消息,或者对某些指定用户发送自定义消息,并可以根据需要自行实现点赞、送礼物、答题等互动功能。秀场直播、语聊房特色功能变声通过改变用户的音调,使输出的声音在感官上与原始声音不同。如男声变女声、机器人音效、外国人音效等。匿名社交、游戏娱乐、角色扮演音乐版权/音效支持通过获取正版曲库资源,播放背景音乐,并展示变声混响多种趣味效果。在线KTV美颜美型基于 AI 视觉服务,提供美白、磨皮、锐化、红润等基础的美颜功能,支持大眼、瘦脸、小嘴、亮眼、白牙、瘦鼻等美型效果,打造独特自然的直播效果。秀场直播、音视频通话、社交小游戏送礼物支持用户向房间内主播或其他指定用户赠送礼物。秀场直播、社交小游戏小游戏提供直播间内的实时PVP、语音互动、桌游、秀场互动等多种小游戏类型,助力客户提高产品活跃、留存、使用时长及营收能力社交+小游戏在线教育场景
在线教育领域的场景含:职业教育、K12教育、素质教育、学历考试等,在线教育场景因比较成熟,各细分场景的功能要求也比较相似,围绕着老师与学生在教学过程中的互动,丰富课堂内容提升教学质量。如屏幕共享、超级白板等功能。
SDK 或服务功能描述业务场景基础功能实时音频为课堂里的教师和学生提供实时的音视频互动功能。职业教育、K12教育、素质教育、学历考试实时音视频提供高清流畅、多平台互通、低延迟、高并发的音视频服务。职业教育、K12教育、素质教育、学历考试屏幕共享教师能与学生之间共享课件,丰富课堂教学内容。职业教育、K12教育、素质教育、学历考试文件共享能将主流的文件格式类型转码为平台无关的格式,并无损还原原文档内容、格式、布局、动画。职业教育、K12教育、素质教育、学历考试进阶功能超级白板能提供实时的白板互动,做到音画同步,提高课堂教学质量。职业教育、K12教育、素质教育、学历考试云端录制回放快速实现音视频通话及会议直播的录制功能,支持录制回放职业教育、K12教育、素质教育、学历考试即时通讯IM丰富的 API 接口,快速实现单聊、群聊、房间、系统通知能力职业教育、K12教育、素质教育、学历考试特色功能AI美声美颜基于领先的 AI 算法,提供包括美颜、美型、美妆、滤镜、贴纸、智能分割、人脸检测等功能,实现美颜实时渲染,打造自然美颜效果职业教育、K12教育、素质教育、学历考试百万大房间房间内支持百万用户同时观看直播,秒级平滑扩容职业教育、K12教育、素质教育、学历考试元宇宙场景
随着互动技术矩阵逐渐完善,沉浸式体验升级,音视频向元宇宙进阶。
虚拟形象、虚拟直播、虚拟语聊等元宇宙新场景,对实时音视频互动也提出了更高要求,要求更低的延迟和音视频交互质量,为用户提供更沉浸式的使用体验。 主要功能功能描述业务场景基础功能音视频通话预留灵活、友好的扩展接口,快速接入即构实时音视频服务。让音视频无处不在,满足用户在元宇宙里实时交流虚拟直播、虚拟语聊、虚拟K歌、虚拟会议实时音视频超低延时下,观众实时接收主播的音视频流,直播流畅不卡顿。虚拟直播、虚拟语聊、虚拟K歌、虚拟会议进阶功能实时消息互动通过房间实时消息功能,实时展示房间内的消息,例如发消息、进退房提示、互动通知等。虚拟语聊实时录制快速实现音视频通话及会议直播的录制功能,支持录制回放虚拟会议超低延迟合唱超低延迟合唱体验,端到端延迟低于 70 ms,达到人体无感官延迟水平,全球用户均可享受真正实时的体验虚拟K歌音乐音效200万+首词库版权,覆盖热门歌曲,快速实现 k 歌业务。通过获取正版曲库资源,播放背景音乐,并展示变声混响多种趣味效果。虚拟K歌送礼物支持用户向房间内主播或其他指定用户赠送礼物。虚拟直播、虚拟语聊、虚拟K歌范围语音让声音具有距离感,超出限定范围则无法听到声音虚拟K歌、虚拟语聊房、虚拟会议、虚拟演唱会、虚拟发布会特色功能焦点语音最高50人同时开麦,支持焦点语音,提供优质稳定的基础体验虚拟语聊Avatar 虚拟形象自定义捏脸换装,塑造个性化形象。快速生成专属形象,提供200+素材,支持表情随动和肢体随动手势识别等AI能力。虚拟人、虚拟K歌、虚拟语聊房、虚拟会议、虚拟演唱会、虚拟发布会3D场景无需Unity开发经验,半天快速实现3D虚拟场景的渲染。丰富的场景拓展能力,支持快速搭建虚拟场景。虚拟K歌、虚拟语聊房、虚拟会议、虚拟演唱会、虚拟发布会3D空间音效支持20+模拟真实 K 歌体验,进行 3D 空间音效渲染,声音将会随距离的增加而衰减,直至超出所设置的范围,则不再有声音。虚拟K歌、虚拟语聊房、虚拟会议、虚拟演唱会、虚拟发布会万人实时状态同步提供多人同屏下,人物位移、动作、场景交互等状态的实时同步,支持万人量级高并发的场景,保障稳定的帧数据同步服务。虚拟发布会、虚拟会议人物控制与场景交互提供摇杆控制人物在场景中自由移动。提供丰富多样的预置人物动作库,提供第一视角、第三视角等多种视角切换能力。提供人与人,人与场景的互动能力。虚拟K歌、虚拟语聊房、虚拟会议、虚拟演唱会、虚拟发布会五、技术指标强弱