“隐形巨头”声网:实时音视频技术支持者浮出水面

多年以后,2020年会从许多切面上被定义为变革的一年。其中之一是,实时音视频技术彻底变成了一项基础设施级别的能力。一年的时间里,成熟的视频会议模式出现,在线教育在争议中成为共识,新的实时语音聊天风靡一时。人们的生活越来越多地基于实时音视频服务展开,更多人也开始关注支撑这些应用场景背后共通的底层技术。

文/油醋

一家叫做声网(Agora)的幕后技术支持者也终于浮出水面。

神秘的技术公司

成立于2013年的声网是一家专注于音视频实时互动的的云服务商。以ToB业务为主的声网主要以提供应用编程接口(API)的模式与开发者合作,后者得到即插即用的技术支持,而声网则向开发者收取服务费用。许多炙手可热的在线教育公司以及实时音频社交媒体都是声网的客户。

2020年疫情之下,全球范围内对于实时音视频技术的爆发式需求在一定程度上促成了声网在服务规模上的质变。一年内声网的实时音视频月均用量超过400亿分钟,累计纯RTC(real-time communication)的PaaS实时音视频分钟数超10,000亿分钟。公司也在去年6月奔赴纳斯达克上市,到现在为止,其股价已经从 IPO发行价的单股20美元涨到57.33美元。

从开发者到资本市场都在持续看好这家公司,光亮之下,其浓重的技术基因也越发显眼。

从2014年在硅谷成立开始,声网的核心团队就在音视频领域有着非常强的技术能力。

CEO赵斌在2005年从硅谷回国创办泥巴网,几年后以CTO身份加入YY语音,带着包括后来出任YY技术委员会主席的陶思明(后担任声网CTO现已离职)在内的技术团队重写了底层技术后,直接在2012年将YY语音提升为一个月活6600万人以上的现象级语音产品。YY语音在2012年就实现了 4000 亿分钟的语音通话服务,这个产业所蕴含的巨大前景也成为赵斌离开YY语音创办声网的原因。

声网首席科学家钟声也背景坚实,曾任海信芯片总经理、博通资深主任科学家、华亚微电子技术副总裁。在美国拥有50余项技术专利,在中国拥有超过 20 项技术专利。同时钟声也曾是 MPEG/JVT (H.264) 与 INCITS 主要成员,IEEE 成员,并发表了 30 余篇论文,内容覆盖了模式识别、视频编解码、计算机视觉等技术领域。

钟声

钟声

团队中的首席视频科学家楼剑则是前摩托罗拉首席研究科学家,后曾作为前苹果公司视频架构师,参与苹果公司第一、二、三代视频编解码器的算法研究和开发,参与的产品和功能包iPhone,iPad和Mac上的FaceTime,AirPlay,视频录像和视频转码等。拥有22项美国专利授权和18项中国专利授权。

这种技术特质也更直观的体现在研发投入上。财报显示,声网在2020财年的研发投入达到4950千万美元,连续三年的投入涨幅都在100%以上。而2020年同比增长了109.5%,高于总营收107.3%的涨幅。

声网在财报中解释其研发投入的增长主要来自充实研发团队所致的人员成本增加,而在上个财年末尾,声网研发人员总数达282人,占到总数的57%。

声网走向“声场”

声网成立之初,国内在移动端实时音视频互动这方面鲜有服务商玩家。直到声网在去年实现实时音视频分钟数月均用量(1600亿分钟)同比4倍增长,大家才意识到它已经是一个强大的技术平台公司。

越来越多的人关注到这家公司,质疑也随之而来。

由于业务扩大带来的带宽与托管成本增加,以及服务器等设备的折旧费用增加,声网在2020年第四季度的净亏损和毛利率都有所下降。并且在2020年度财报中,声网依靠实时音视频服务的收入占比仍然高达98.2%,延续了过去两年占比高于98%的情况。

作为一家上市公司,收入结构单一总不免让人担心。在招股书中被声网作为竞争对手提及的美国公司Twilio,虽然主要营收也来自开发者的服务费用,但其同时也推出短信验证码、短信通知等服务来分散收入结构单一化带来的风险。

同样的发展路径声网无法复制,围绕服务尽早布局生态可能是另一条路。

赵斌曾表示2017年以前的声网“实际上没人用,也不知道谁需要”,而从声网最近的一些收购行为来看,曾经模糊的应用方向现在逐渐清楚——在线场景和即时通讯。

今年1月28日,声网发布公告称完成了对在线互动白板公司Netless的全资收购,同时在一季度内将会完成对软件服务提供商环信的收购。前者是一家专攻在线教育、在线会议以及其他协作办公场景的互动白板服务商,后者则是国内领先的即时通讯云和客服云服务商,阿里、腾讯、猿辅导等用户体量巨大的互联网公司都是其客户。

两笔收购的指向性明确,使得声网在两个确定方向上作为一站式解决方案的服务能力进一步提升,也正在实现自己从RTC向RTE(Real-Time Engagement )——即将包括IM,白板等在内的丰富技术组合搭载于RTC之上——的转变。与此同时,这个将自己定义为开发者社区的公司也还不急于走到台前,此刻更像一个手里攥着技术找项目的投资人角色。

在前日“声网Agora创业支持计划”的发布会上,声网Agora市场运营副总裁曹璐提到了“声场”这个概念。曹璐表示,未来的竞争不在技术或者产品层面,而在生态。在一个以语音作为底层技术的场域里,声网的生态圈正在形成。

“在之前很长一段时间之内,我们的生活都依赖着在线远程的方式推进,有的人会说既然这个时期已经结束了,会不会回到从前?我们的观察是,已经回不去了。因为大家会发现线上跟线下的结合,往往能够拓宽到更多的场景,让大家的体验更加多维。”

随着实时音视频技术的未来空间已经不再是“远见”,声网所面临的另一个忧虑在于当更多具备研发实力的大厂强势入场,声网在技术能力上的优势能否保持。

阿里巴巴与腾讯都在2018年发布了RTC的解决方案,腾讯会议更是在9个月内将用户数量提升一亿。大厂很容易依靠自己生态内的巨大流量对行业内的头部公司形成颠覆。

于是对于声网来说,尽早将技术优势兑现到生态布局上形成护城河显得十分重要。而避开与大厂烧钱竞争的正面战场,寻找那些赛道切入点更小但对行业理解很深的初创公司,对于声网来说是更有收益的选择。

语音社交软件Yalla近日发布了2020年财报,年营收增长了113%,股价相比发行价上涨219%;线上活动平台Airmeet则在去年单季度用户增长了2000%。两家归属实时互联网概念下的出海公司在同一时期迎来了数据增长,而Yalla和Airmeet也是典型的声网生态圈内的公司。

“A轮以前的初创公司会是声网投注最多关注的对象。”曹璐表示。

声网“声场”概念的核心,在于依靠实时互动的技术来搭建以API为合作模式的生态。对于开发者,声网会赠送每年100万的音视频分钟数,预计未来累计赠送的音视频分钟数将超过10亿。当下的风口期逐渐缩短,抓住机遇的空档转瞬即逝,这使得一些具备潜力的产品可以免去一部分底层技术的开发时间成本,更快速的在市场里跑起来。

声网表示,100万的分钟数基本足够让一个产品马上可以进入上线阶段,并且找到痛点。也足够验证这家公司能否被市场接受。

许多初创公司已经通过这条路径成为细分领域里的独角兽公司,甚至完成上市。狼人杀App在2017年爆红后模仿者不绝,但至今仍然是社交游戏类榜单中最热门的几款社交游戏之一;而前面提到的Yalla已经在去年9月登陆美股,如今股价稳定在单股25美元。而在开发者方面,截止2020年末,声网全球注册应用已经超27.2万。

在2020年声网三季度财报电话会议中,摩根士丹利研究员向赵斌问起如何看待行业日益激烈的竞争,赵斌表示拥有业内最大的开发者社区也是声网保持自身竞争优势的底牌之一。

美国投资机构Mangrove Capital Partners在《2019年语音技术报告》中预测,语音经济在2025年的规模将达到1万亿美元,超过移动应用经济。虽然眼下与实时音视频有关的产品已经种类繁多,但相关技术和整个行业仍然处于发展早期,声网对于自身生态的打造也还播种大于收获。而可以预计的是,这家隐形巨头在未来会有更多故事可讲。

您可能还会对下面的文章感兴趣: