头条在2019年初开始主推搜索的时候,百度正在发力短视频。上周,百度和头条又打起来了,就是因为头条的搜索业务。
4月26日,百度起诉头条在搜索结果中大量抓取百度搜索top1的结果,要求立即停止侵权,赔偿9000万元并连续30天在其APP及网站首页道歉。
在同一天,抖音以不正当竞争为由将百度诉至法院,因发现百度在搜索中窃取了海量抖音短视频。抖音要求百度立即停止侵权,赔偿9000万元并在百度首页连续道歉30天。
百度和头条之间的竞争一直互相交错、纠缠不清。信息流、短视频,这些业务的争夺,动辄就是百亿的广告市场份额的得失。如果说百度原来是大街上的一家中餐厅,头条的信息流相当于在隔壁开了一家西餐厅,百度和头条的关系属于竞争,但不至于水火不容。现在头条开始做搜索,就好比在路对面又开了一家中餐厅,这是直接进攻百度大本营,如果说之前的争斗关乎钱,那这次是关乎基业,关乎命,可谓是生死之战。
百度和头条不断地侵入到对方的领域,业务也走得越来越像。就在上周,有媒体报道称百度在开发一款产品,形态是线上的抖音+线下的歌手。为何百度和头条会打得如此的胶着、激烈?其根本在于两家公司的基业存在着很多的相似之处,无论是主动搜索还是被动推荐,百度和头条做的,都是信息筛选的生意。而信息筛选的基础,就是数据(内容+服务)和算法。
通过数据和算法,搜索和推荐这两种形态的业务,有了衔接点和过渡点,双方的重合度就会越来越高。当头条的推荐做的足够好的时候,做搜索就是必然。
一、百度和头条的算法
搜索的两个基础条件:数据和算法。百度的搜索引擎结果排序和头条的信息流推荐,都是算法。
这两种算法,从表现形式上是不同的。搜索引擎的算法追求的是精准,用户输入关键词,如果返回结果(不考虑广告)是10条,那越优质的内容应该排得越靠前。比如说,Top1就应该是当前*的答案。对于好的标准,是基于结果页被引用的次数等维度,这个结果对于大多数人来说是*结果,在当前关键字下,是一个标准的求解。
头条的算法,基于内容生态属于消费型,容错率比百度高。比如,对于某个用户,当前一屏10条内容,可以推荐5条体育新闻,5条娱乐新闻,都可能是用户感兴趣的。而这10条新闻中,有2条可能用户兴趣度并不高。但是对于内容消费型的推荐结果,是允许这种情况存在,2条匹配度不高的内容并不会对用户使用体验造成特别大的影响。
头条的算法,推荐维度上比较复杂。我们可以这样具象化的简单理解:百度的搜索结果,是一条内容流,基于搜索关键词展现相关度最高的内容。而头条用户每屏内容,是基于用户兴趣,如体育、娱乐等多条内容流,初始状态下,是根据用户特征进行的推荐。比如,用户在没有发起搜索的时候,其实可以认为信息流在默认地为某个特征,比如“体育”展示搜索结果。
当用户在头条主动发起搜索后,信息流在原先的结果中,根据关键字匹配出相关度更高的内容展示。比如搜索“足球”,就会在“体育”的搜索结果中选择与足球相关的内容,减少甚至去除原先娱乐特征下的内容。
也就是说,头条的推荐结果,本身就是多个小的搜索引擎在同时工作,推荐和搜索,本质上是没有太大的差别。
那么,头条的搜索引擎做的够好吗?这在信息流大战中头条已经证明了自己,头条的算法无论是在灵敏度还是复杂度上,都是建立起了一定的壁垒。
算法推荐,可以细分为三个阶段:数据准备、数据检索和数据推荐。头条经过多年的头条号、头条问答、微头条等内容建立,算法的不断优化,起码已经准备得有能力一战了。
头条和百度的搜索,又有可能不一样。百度虽然多次提到要做搜索结果千人千面,但目前还是给每位用户推荐标准版的结果。举个例子,如果搜索结果的来源有机构、个人站点等多个维度,那机构站点的权重可能高于个人站点,导致相同的内容下,机构站点会在显示结果中排在个人站点前面。由于当前关键字下搜索结果的排序是基于网站本身的权重和属性,对于所有的用户最终显示的结果都一样的。
而头条目前的内容体系除了阅、转、评、赞等赋予内容本身的属性和权重外,用户自身还存在大量的特征,搜索结果对应的匹配,又多了一层用户特征的过滤,因此每一个用户在同样关键字的搜索结果下,会得到不同的内容展示,也就是千人千面。目前不同用户在头条的搜索结果差异并不明显,但是确实存在不同。
百度不是说没有用户特征,而是百度多年来未完善的用户体系,导致至今没有很准确的用户特征。这也是百度在今年春节期间,除了大力推广手机百度和视频等单独的应用外,也希望通过打通用户账号来建立一个比较完善的用户体系。
二、百度和头条的数据
搜索的另一个基础条件是数据。头条和百度在数据储备上差距大吗?谁的数据更优?
百度自然不必说,通过多年的积累,被认为拥有全网的数据,但现在对百度来说情况早已开始起变化。比如说拥有海量用户微信的数据,百度拿不到;头条号的数据,百度拿不到。
反观头条,其数据储备正在快速的增长。头条起家时用爬虫网罗了大量的数据,媒体的资讯、微博的内容,到现在头条建立起来的内容生态,头条号、微头条、问答,以及第三方内容,比如互动百科、360百科等,头条的数据储备也具备开展搜索业务的基础。甚至,对于大多数普通的内容使用者来说,头条的数据优于百度。
百度近些年来在内容生态的短缺,造成了与互联网信息的割裂,百度对内容的把控开始显得不足。很多企业在近些年逐渐地把网站作为一个基本信息展现的地方,甚至放弃PC端网站。反而是企业的头条号、公众号,有大量的信息不断地产出,而这是百度无法收录到的。
直到百家号的出现。今年初,一篇《搜索引擎已死》,重新挑起了人们对于百度生态的怀疑,百度大力发展的百家号,被指是将流量圈在自家体系中。事实上,对于百度来讲,这是对自身体系的一种补救。百家号的这种策略,从商业的角度来看是正确的,如果没做百家号,那现在头条做搜索,百度会更加的被动。反观头条,依仗得不就是数据逐渐丰富的优势吗?
三、头条做搜索的必然
头条拥有足够的数据储备和算法能力,进军搜索是必然。而且,张一鸣也有足够的商业动力去这么做。头条发展凶猛,但是头条有压力吗?有的。互联网红利消失,每一家互联网公司都有发展压力,当然头条也有。前些年头条的发展速度太快了,以致于现在对于头条来说,想要达到之前的增速几乎是不可能了。而就在今年初,传出了今日头条母公司字节跳动要上市的消息。如果要在上市后给资本市场交代,那搜索这块既成熟,又顺手,又肥的业务,是头条*的选择。
如果说百度某天突然消失了,李彦宏手里只剩全网的数据和一套成型的算法,那李彦宏会做什么?李彦宏应该依然会做搜索引擎,或者去做一个头条。
现在的情况是,张一鸣恰巧有家店面,还有几个不错的厨子。那对他来说,开个餐馆,是顺气自然,也是必然。这也就是,头条现在具备了数据储备,具备了算法能力,去做搜索也是必然。
搜索引擎需要的数据,无非就是内容+服务。内容方面,百度和头条各有优劣,但是服务,两家的能力都不能算及格。
近些年来,百度的搜索引擎对用户在交易(服务)方面的能力不断地弱化,消费者的习惯改变,早已不会在PC甚至是移动端的网页上进行交易。而且,百度在账号体系和支付方面的不足,甚至自身都不能完成很好的闭环。同样,头条在这方面和百度半斤八两,这也就不难理解,头条和百度,都在跟进小程序了,这是完成服务闭环的一个解决方案。百度和头条今年春节大战的红包提现,都有意识在支付的环节上进行完善。
百度和头条,在搜索引擎的基础建设上,一个是守城,一个是进攻。城墙并非牢不可破,进攻方并非无坚不摧,这也是,双方才有打这场仗的必要。搜索的战场,未完,待续...