打开APP

张春晖创业视频项目Autotiming 获薛蛮子曾李青等天使投资

在张春晖看来,Autotiming这个新创业的项目是语音识别的阶段性成果最好的展现,AutoTiming将人从繁琐的视频字幕匹配/校对中解脱出来,通过已知的视频文字脚本和音频一一对应。
松禾资本投资总监张春晖最近有了一个新的身份——Autotiming的创始人。他自2009年加盟松禾资本,曾独自完成第七大道、乐蛙、佳品网、友加、AppleToon等20个TMT项目的投资。

 

张春晖

  Autotiming是一款集语音-文字匹配技术及媒资管理于一身的云平台,项目自2013年5月份创立就已经获得了多位重量级大佬的天使投资,包括投资美国三大广播电视公司之一NBCUniversal的美国SCG基金、国内著名天使曾李青、薛蛮子、王利杰、麦刚等。

  经历了创业-投资再回到创业的过程,张春晖感慨颇多,“其实我已经很多年不穿西装了,现在因为站到前台创业,又重新开始穿了。”他笑称。张春晖是中国互联网早期建设者之一,中国第一个互联网站“深圳之窗”及第一个BBS站“一网情深”创建者。2000年离开中国电信后,张春晖曾经创办过网络安全公司安络和电子杂志平台的主流网

  在张春晖看来,Autotiming这个新创业的项目是语音识别的阶段性成果最好的展现,AutoTiming将人从繁琐的视频字幕匹配/校对中解脱出来,通过已知的视频文字脚本和音频一一对应,将句子语音段形成字语音段匹配到对应的文字上,将文本信息的每个字/单词都变成一个节点,实际上经过这样的技术处理,他完成的是视频结构化工作。配合另一个强大的媒资管理技术,事实上视频已经完全被结构化、碎片化,完全颠覆了传统视频无法全文搜索、无法有效分享、有法进行SNS化的瓶颈。在Autotiming云媒资平台上,你可以通过关键字搜索视频内容,或通过一幅图片搜索到海量视频中对应的帧,以及在播放视频的过程中随时将某一个片段分享到微信与微博。

  在张春晖的设想中,AutoTiming是一个引擎,通过其精确的字幕匹配服务及媒资管理获得海外市场的内容,完成对内容的精细化加工与分发,加工过的内容再转回国内进行市场化运作。“我们将从美国市场开始,自1976年起美国法律要求广播电视必须配有字幕,英联邦国家及日本等国家也都具备这样的技术环境,为Autotiming提供了很好的市场环境。中国虽然也出台了“信息沟通无障碍条例”但仍不是强制性的,所以国内市场主要是媒资管理及内容分发为主,张春晖称。

  目前Autotiming已经商业化的二个产品为:字幕匹配和媒资管理,在此基础上又封装了两个垂直应用:此时此课(公开课)与舆情监控。而张春晖将重心放在字幕匹配和媒资管理上。“这两项都是产品的核心,包括‘此时此课’等应用都可以通过合作伙伴来合作运营。”张春晖介绍。实际上公开项目“此时此课”以及“舆情监控”也是AutoTiming重要的产品线。“此时此课”主要是以大学公开课为主,一字一音的跟读、点词复看复读、关键词全文搜索等功能,已经让这个产品的体验远远超过市面可见的“公开课”。舆情管理主要面对的用户是政府以及上市公司,上市公司每年都会有固定的媒介费用进行媒体监测,但在电视媒体方面的时效很差。而Autotiming每天实时处理全球上百个电视频道,用户只需要订制关键词就可以获得精准、实时的视频推送。

  据了解,目前海外多家电视台都对AutoTiming表现出了合作的意向,彼此已经建立了一定的认可度。根据张春晖的计划,2013年第四季度之前公司仍在铺设平台,8月份媒资管理平台将正式上线,通过完成与美国日本等国家的电视台进行合作后再进入市场拓展。

  AutoTiming其中一个音文匹配技术属于广域上的语音识别范畴,与直接识别语音形成文字不同的是,它只对语音和文字进行配对。但它同时需要运用尖端的语音识别技术,例如对强口音、高背噪等的技术处理。目前全球视频的字幕匹配工作都是人工完成,一小时的新闻节目需要2-3小时完成,而一小时的綜艺节目、足球等体育赛事,起码需要5-7小时人工才能完成,而Autotiming的自动匹配技术,100%全自动,只需要5分钟就可以完成上述复杂语音环境的匹配工作。目前已有国际体育集团与Autotiming接洽,寻求为他们解决在体育赛事中噪音中语音识别的难题。

  核心技术7年曲折创业经历30年理论基础上再创新

  AutoTiming由一项智能分类算法下的语音识别技术与媒资管理技术所构成,智能分类算法是由两位最初在英特尔声音研究院,后又就职中科院声音研究所的科学家所设计,这两位科学家在7年前离开中科院开始自己创业,2011年张春晖与这个团队“一见钟情”,最后投资了这个众多知名投资人都没看懂的项目。

  国内的语音识别技术经历了非常曲折的创业过程。目前在语音识别技术中有一个核心是“马可夫过程统计模型”,而且这个模型是在30年前提出的理论。科大讯飞最初在语音识别的路上难以有突破后,转向去做语音TTS,最终也成为了一家上市公司。

  “马可夫过程统计模型就像是一张建筑图纸,这张图纸可以建50层楼,但如果要盖100层楼就要从新设计一张图纸。”张春晖所投资的这项技术在语音识别这条路上也走了很远的路而失望过。最终的结果是决定重新设计了一套自有的有别于马可夫理论的理论。“当我第一次看到这个团队时,他们的办公室没有一张有两个扶手的椅子,这些年可谓是清水配馒头坚持过来的,非常令人钦佩。”张春晖说。“字幕匹配技术只是这两位科学家阶段性的技术成果,它验证了可信分类算法的可行性,我们会支持他们继续走下,直至算法的最终成功,如果它成功了,他们的成就都可以拿诺贝尔奖了!”

  而对于张春晖这位投资人来说,把字幕匹配技术分拆出来,结合媒资管理而诞生Autotiming项目,是因为他看到一个阶段性的成果时,感觉那不仅仅是一个投资的保障,也是一个颠覆视频产业的机会。这个技术已经被商业化应用在中央电视台、北京电视台等广电机构,如果能让它发展得更快些,如果能让它演变出更多的产品,它有可能是下一个10亿美元的项目。张春晖并不担心这项技术是否会被复制,“这项技术目前在国内被复制的可能性很小,美国有可能未来会出现类似的公司。但复制还是很难,因为门槛很高。而且这项技术所应用的市场实在是太大了,大到未来的竞争对手各自上市了还没挨着边。“退一万步讲,即使我只做一个小语种都可以做成上市公司。”他说。

  一个颠覆性的视频平台即将上线了,“大家马上就可以看到视频片段在微信、微博等SNS中广泛传播,视频结构化将带来视频内容的重构,以及改变了视频的传播模式。这一百年以来,视频全文检索、碎片化等大家过去很难想像的功能都一一面世,视频将告别‘重体验’时代,进入碎片化的‘轻视频’时代”,张春晖很自豪的说。

 

【本文为投资界原创,网页转载须在文首注明来源投资界(微信公众号ID:PEdaily2012)及作者名字。微信转载,须在微信原文评论区联系授权。违规转载必究责。】

相关资讯

最新资讯

热门TOP5热门机构 | VC情报局

去投资界看更多精彩内容
【声明:本页面数据来源于公开收集,未经核实,仅供展示和参考。本页面展示的数据信息不代表投资界观点,本页面数据不构成任何对于投资的建议。特别提示:投资有风险,决策请谨慎。】