今日头条张一鸣:媒体希望有格调 但我们希望包罗万象

 20155月最后一个周末,广州,阅读工具“今日头条”的创始人张一鸣在南方报业集团做了一次内部演讲。他对着台下那些传统媒体的看门人说:“我们跟一些媒体不一样,有的媒体是有格调的,他希望他们有格调的内容。我们希望包罗万象,因为我们会给不同的人看不同调性的内容。”

氧分子网(www.yangfenzi.com)讯  对南方报业集团,张一鸣并不陌生。《南方周末》、《南风窗》和《南方都市报》……从这所大院里生产出的新闻纸曾部分地满足了张一鸣的“重度信息需求症”。对出生于1980年代早期的张一鸣和比他更年长的那一代人来说,这些在“开风气之先”的南国边陲被生产和印刷出来的新闻纸,代表着一种态度、格调和时代精神。

  今日头条没有自己的格调,但它有几亿用户。理论上,几亿用户在今日头条上有几亿种格调。

  为了这次演讲,张一鸣准备了一份53页的演示幻灯片。统一的深蓝色背景宣示着科技空间的冷艳和纯粹,那是微微泛黄的新闻纸难以模拟出来的颜色。在幻灯片中,他不断强调着“系统的力量”: 系统“像一个不断生长发育的大脑”,“是网络空间的上帝,俯视所有用户”。张一鸣坚信这个“上帝”能够“抹平信息鸿沟,减轻人脑的负担”。

  这个上帝视角的系统,是“今日头条”的核心。

  被“系统”主宰的知识半径 

  张一鸣在公开场合反复强调:“今日头条”不是一家媒体,而是一家具有媒体属性的科技公司。“我比较经世致用,而科技是第一生产力。”他说,“今日头条”首要解决的就是信息分发效率的问题。

  当年高考志愿填报南开大学,其中一个原因是张一鸣觉得天津是一座美丽的“滨海城市”,然而他所亲历的天津,却没能满足对“滨海城市”的想象,“信息不对称”让他吃了亏。

  和他一同“吃亏”的是大学同学梁汝波。梁汝波也是张一鸣从九九房——他最早的创业项目时期就开始合作的创业伙伴,他们共同拥有的第一份资产,是一台只有256兆内存的电脑。大二学期末,张一鸣的电脑机箱在宿舍被盗,剩下的显示器成了摆设。他问同屋的梁汝波是否愿意去买一部主机,和他剩下的显示器凑成一对,电脑使用权共享。张一鸣承诺,等到大四毕业时,显示器也一并归梁汝波所有。

  从此,梁汝波和张一鸣熟络起来。两个微电子专业的人开始一起钻研计算机科学,学着编程和代码,每周末还会一同打乒乓球和羽毛球。但梁汝波说:他自己运动是因为喜爱,而张一鸣是觉得“应该运动”而坚持了下来。

  等到大三张一鸣转向软件工程专业时,整个电脑的所有权提前转到了梁汝波的名下。现在,梁汝波是今日头条的技术总监。

  梁汝波认定,曾经的这位大学室友生命的中心思想,就是“渴望卓越”。就像张一鸣在自己社交媒体简介栏当中放的第一句话:“逃逸平庸的重力”。用张一鸣自己的解释,就是变成超级赛亚人,然后保持适应,然后再变身更高级的超级赛亚人的过程。梁汝波说,从这样的中心思想而衍生出的所有阅读行为,都是张一鸣的“个人修炼”。无论科技、社会、诗歌还是人文,只要能使他变得更卓越和强大,张一鸣都去阅读。

  张一鸣说自己每天有60%的信息获取来自于自己的产品。在我见他的那天,他的“头条首页”为他推荐了美团和大众点评的用户报告、“乐视A股”、“Google公关跳槽Uber”、“国务院发布网速提升”以及中广核的一则新闻和小米上市的最新传闻。张一鸣一条一条地展示给我,并赞赏每一条对他的价值和令他满意的精准度。

  夹杂在这些消息中间,还有两条关于篮球宝贝和赛车车模的图片新闻,斗争了一下,我还是没好意思去问:这是被系统算准了,还是失准了?

  大胸妹子照片的推送丝毫不会影响张一鸣对系统的信心和赞美。他认为他的系统“跟现实生活中的口碑传播没什么区别,它只是打破了时空限定,更快速的流动了。”

  “像我岳父岳母,给他们用了‘头条’之后,他们知道的东西我发现明显变多了。”张一鸣坚信在“今日头条”这样的产品出现之前,人们的认知水平基本上是被他周围的人所界定的:嘈杂的微信朋友圈、夸夸其谈的出租司机,或是广场上的收音机。

  一个人对知识的获取,是应该被别人界定还是被“系统”界定?张一鸣坚信后者才是救赎与希望。

“报纸的时代更糟糕。一个人订一两份报纸,主编就决定他看什么,主编的狭隘程度就决定他的(狭隘)程度。”

  而张一鸣正是得意于他的系统——被机器和算法驱动的大脑持续地生长发育,俯视所有用户,甚至主宰整个网络空间,变得越来越聪明,推荐不同的信息和内容,扩展每个人不同的知识边界。让人们拥抱更多样无穷尽的信息和价值,避免人生的局促和偏狭。

  张一鸣认为“今日头条既不‘南周’,也不‘环球’”。而《南方周末》和《环球时报》在很多种语境下,正象征着当下人们对中国社会现状认知的两个“偏狭”的极端。

  阳光和油墨香味一点都不重要 

  在“系统”之外,张一鸣仍有40%的“重度信息需求症”需要被治愈,全靠一台Kindle

  这是他的第五台电子书阅读器,里面的书包括了《卓有成效的管理者》、杰克·韦尔奇(Jack Welch)的Winning、《乔布斯传》、《从优秀到卓越》、《基业长青》、《高效能人士的七个习惯》、《自控力》和《沃顿商学院最实用的谈判课》。躲在这些当中的,有一本《乌合之众》。

  在张一鸣的购书逻辑中,Kindle电子版有着绝对的优先级。半年来,他也不曾买过任何纸质报刊,“我在报亭只买可乐”。

  曾经有人在他的微信朋友圈呼吁国家应该多建图书馆,张一鸣在第一时间留言反对。“(我)鄙视了他一下。你还不如给学生发Kindle,你想那个(图书馆)更新得多陈旧、速度多慢、也看不到书评。”他觉得如果在自己小学三年级那会儿就能有搜索引擎、推荐引擎、今日头条和维基百科的话,那将是多么棒的童年。张一鸣说,他正计划着过年时不再给亲友的孩子们发红包,而是每人一台Kindle,里面充上两千块钱,“对他们的人生改变肯定很大。”

  在他还不得不读纸质书的年代,张一鸣买书时会从五道口站一路走下去,盗版地摊、新华书店,直到万圣书园,走到哪里买到哪里。在哪里买,在哪里看,对他而言都不重要。“我也在书店看很多书,但是不沉浸,就是说没了就没了,没了会有更好的,更面向未来的。”

  每每说到像“纸墨香”一般的事物时,张一鸣都会用“欣赏怀念不沉浸”来表示自己的态度。他更喜欢将拉链、青霉素和避孕套作为“今日头条”的类比,“重要的技术一定是改变大众……我觉得这个是意义更大的,大规模改变更多普通人是意义更大的。任何一小撮人感觉良好的,我觉得有文艺价值,但是它社会价值就小。”

  “一缕阳光打进来落在书页上,印着油墨的味道散发出来,南开大学里面的图书馆经常是80年代和90年代的书。但是电子书比他们牛多了,在我看来,阳光和油墨香味一点都不重要。”张一鸣觉得关注这些的人其实是太关注自我,“他们会被情绪控制。”

  几个问题下来,张一鸣突然探过身,反问道:“你文艺么?”

  我:“这是我下面想问你的。”

  张一鸣:“我觉得文艺的人才可能会挑剔一点。”

  我:“你文艺么?”

  张一鸣:“我不文艺,我还是太practical(实用的)。我觉得实用主义非常重要,你应该了解很多,你应该有理想,但是都应该practical,因为不practical不管用,你最终还是要对社会、对人、对自己有作用有帮助,所以我觉得任何事情的前提都是practical。”

  对“事物尽头的看待” 

  今日头条的市场副总裁林楚方说,张一鸣是他见过的自律性最强的人。“他很少发脾气,生气的方法就是不理你,但是也很少。情绪的管理就像是机器人。”常年浸淫在传统媒体的林楚方曾惊讶于公司会议上的张一鸣:提前5分钟到场,不寒暄,5分钟的时间只是自我学习、一个会通常不会超过15分钟。

  在张一鸣还要去报亭买《南方周末》的时候,林楚方正是那份报纸最当红的记者编辑之一。在2014年,林楚方以《壹读》杂志主编的身份采访张一鸣后,两人就彼此引以为同类。张一鸣觉得林楚方“也不文艺”,林楚方则找到了一个病况更加严重的“重度信息需求症”病友。

  林楚方说,最开始接触张一鸣的系统时,是“上瘾”的感觉。“阅读瀑布流的感觉,不断地收到。只要你想看,永远有看不完的信息和资讯。”

  在南方报业集团讲座的前一个礼拜,张一鸣在自己的公司内部做了一次被员工称为“第一次洗脑”的演讲。他对着自己正在疯狂扩张的队伍讲“我们要去哪里?”、“哪里有什么样的情况?”、“我们会遇到哪些拦路虎?”、“我们的里程碑是哪几个?”

  坐在下面的梁汝波发觉,这么多年之后,张一鸣还是那个样子——普通话特别糟糕,也不太适合演讲,“但他就是润物细无声,你得经历了一段时间,才会觉得这个人,很靠谱。”

  这个心中有一个理想的上帝视角的机器系统,行事风格也遵循系统的瘦小的理工男,正在成为传统媒体心目中的“掠夺者”和技术理性派心目中媒体行业的“变革者”。但是无论是谁也不知道,这个创造并驯化出的“上帝系统”的旧媒体门外汉和新媒体执神杖者,究竟会成为又一个约翰内斯·古腾堡(印刷机的发明者),还是会把古腾堡流传下来的所有遗产彻底砸烂。

  张一鸣说他自己“比较喜欢从宏观的角度,更长时间跨度和更大人群的角度看问题。”而林楚方也曾经问过张一鸣:“你是不是一个追求极致的人?”张一鸣给出了否定的答案。成为同事之后,林楚方逐渐发现,张一鸣追求更多的其实是可行性以及对“事物尽头的看待”。

  而越来越多的人开始相信,在张一鸣看到的“事物的尽头”,是传统媒体的万劫不覆和像上帝一样的“系统”的在网络空间里的滋长和永生。在这个空间里,没有古腾堡发明的印刷机和那些泛黄的沙沙作响的新闻纸。 (文/刘鹏  PingWest品玩)

·氧分子网(www.yangfenzi.com)延伸阅读:

希望张一鸣同学知行合一

如果我是一个传统媒体负责人,会花几天时间和张一鸣聊聊

张一鸣:找出变化中差距,在移动互联网杀出一条血路

今日头条张一鸣:百度成就比我更懂我资讯黑马

张一鸣:我们不是新闻“搬运工”,有问题欢迎大家找我来谈

您可能还喜欢…

1 Response

  1. 前几天写过一篇「哪些职业容易被机器算法取代」,很多人不以为然:我天天上网,怎么没感到机器算法呢?真那么智能,注册个账户又是密码又是安全问题两步验证,怎么不搞智能一点呢?

    现阶段的机器算法,并不是指具备高等智能的机器人,也不是有人类情感的仿生人,不过算法确实在我们的生活中发挥着各种各样的作用。比如你打开浏览器在网上闲逛的时候,你会发现某个网站的某个广告会出现一个你心仪品牌的羽毛球鞋的图片,点进去之后你发现可以直接购买这款鞋子,出现这样的推荐是因为你前几天在这个网站上买了一只同品牌的羽毛球拍。为了学习人工智能,你买了一本《深度学习》,在付款的时候,你会发现页面下方会冒出了几本《机器学习实战》《Python 机器学习》的书,你忍不住又买了一本……

    这就是算法的力量,确切的说,是推荐算法在起作用。

    随着信息技术和互联网的发展,人们逐渐从信息匮乏的盲区走入了信息过载(information overload)的时代。以推荐算法为核心技术的推荐系统凭借其个性化推荐和有效降低信息噪音的特点开始被广泛使用,比如国外的 Google、Facebook 和国内的今日头条。

    不过,就像谈到程序员和工程师就会想到修电脑的一样,很多人,尤其是非 IT 领域从业者,对算法的理解游走在「算数」与「魔法」两个边缘,有很大的认知误区。下面我主要以内容推荐领域的今日头条和商品推荐领域的亚马逊为例,跟大家聊聊推荐算法,帮助读者更好的理解这个时代的互联网生活。

    误区一:推荐算法是根据用户点击率来推荐
    这可能算是对算法最大的误解之一了。

    我们经常说,推荐算法实现了个性化推荐效果,每个人看到的东西都是不一样的。这个说法忽略了一个重要的事实:大多数人喜欢的东西实际上高度类似,比如最火的流行歌曲、最新的明星八卦。

    多年前今日头条出现,喊出了你感兴趣的才是头条。门户网站之所以觉得很平常没有跟进,也是陷入了算法等于点击的陷阱 —— 按照热度排新闻,是各大门户网站早就有的功能,有什么新鲜的呢?

    真正能挖掘长尾的个性化推荐,其实是反点击的,否则很难实现个性化的需求挖掘。系统需要跟进更多的用户信息维度和多种算法模型来发现和挖掘长尾需求。《长尾理论》曾经举过一个著名的例子。1988年,乔·辛普森写了一本登山类的书籍《触及巅峰》,但销量一直很普通。10年后,另一本讲述登山灾难的书《进入稀薄空气》引起了美国出版业的轰动。亚马逊发现有读者在评价《进入稀薄空气》时提到了《触及巅峰》,同时给出了高评价,于是将《触及巅峰》推荐给了《进入稀薄空气》的深度读者。很快,《触及巅峰》在经过十年的惨淡销量后,获得了巨大的成功。

    实际上,亚马逊做的事情就是算法推荐现在做的事。推荐过程不仅要考虑用户的阅读轨迹,同时还要考虑用户的性别,年龄,甚至手机机型等信息,同时还要综合考虑新闻的时效性、以及地理位置等信息对内容进行相应推荐。而如果只看点击(销量),《触及巅峰》可能永远也不会获得推荐。

    误区二:冰箱都买完了还推荐冰箱,点了不喜欢还推荐,算法一点都不聪明
    假如你的微信只有一个好友联系人,会觉得朋友圈好玩吗?

    朋友圈需要更多的好友,算法推荐也需要更多的数据。对新用户来说,一个系统或者平台可以推荐的内容是天文数字。以淘宝为例,2013 年的时候,淘宝在线商品数就超过了 8 亿,8 亿个候选,推哪一个?

    这时候,点击或者浏览过的商品/文章,显然权重是最高的。对直接销售物品的电商来说更是如此,所以无论是国外的亚马逊还是国内的淘宝、京东,实践下来,当前浏览内容都是最重要的推荐因素。

    而且,买过冰箱推荐冰箱,也未必是算法笨,这可能只是一个简单的策略问题 —— 你买了冰箱,周围的朋友可能会咨询你冰箱的问题;如果你看到了更喜欢的新款冰箱,很可能在退货时间内选择了退了原来商家的冰箱,买个新冰箱。并且这个策略很可能造成最后的销售数据的极大提升。

    对相关新闻点击「不敢兴趣」也类似。当你第一次对奥巴马演讲点击「不感兴趣」时,系统不知道你是对奥巴马不感兴趣还是对演讲不感兴趣,或者单纯不喜欢这次的演讲主题,所以反而会继续给你推荐相关的话题,从整体数据来看,这样的推荐策略有时候是更优的。

    当然,个性化推荐为了防止过渡拟合出现,会根据读者的阅读纪录通过严谨的数学理论分析计算,推测出同类用户偏好,依兴趣标签的关联程度,推测出同类用户其他偏好,并进行「联想式」的推荐。比如当机器发现阅读「总统大选」相关信息的用户群体中,有很大部分人都在同时关注「股票」信息,那么机器就会把「股票」信息推荐给那部分关注「总统大选」但尚未关注「股票」信息的人,而不会单一推荐「总统大选」的信息。

    误区三:推荐算法会导致「信息茧房」
    有一种论调是,由于算法只给你推送你喜欢的内容,从而造成了信息茧房。

    展开来说,这个论调包括两层,一是大家只关心自己的小世界,看不到更重要、更有意义的公共事件。二是算法越来越懂你,你喜欢特朗普,就只给你推荐特朗普好的新闻。最终的结果,造成了「信息茧房」和偏食。

    这其实是不成立的。在实际情况中,算法很难实现「信息茧房」。公共事件之所以成为公共事业,是因为其公共性,这决定了其天然具有穿透性,所有算法都会对此类事件赋予极高的权重,否则这将违反算法准确性的初衷。

    其次,关于态度倾向。因为每个人可能感兴趣的文章非常多,用专业话就是数据非常稀疏,所以对算法来说,正向情绪和负向情绪,都是对某一个话题的正相关,这种相关性本身大于情绪。这句话翻译过来就是,无论你讨厌特朗普还是喜欢特朗普,在数据意义上的表现,都是对特朗普这个话题高度相关的。对于算法来说,正常情况下,所有关于特朗普的重要内容,都会被优先推荐给你。

    从哲学思辨的角度来看,「信息茧房」或许有其意义,但从实际操作中,不可能出现这样的极端情况。另外,互联网时代,由于信息的极大丰富,任何选择都会对信息本身进行过滤和筛选。你的微博、朋友圈也是「信息茧房」—— 因为你看到的都是朋友们关心的。

    误区四:推荐算法技术含量不高 按照算法模型拿 Cookie 信息套一下就行
    首先,严格来说,算法是解决问题的一个过程,包括特定输入与特定输出。我们讲的数学公式只是算法的理论基础,无论是推荐算法还是深度学习网络不仅仅需要理论基础,也就是公式,还要有相应的数学模型实现,并且这个实现过程是动态的,需要不断调整的。

    实际上算法的自我修正和学习是非常重要的,比如阿尔法狗就是不断的和人类对弈来优化自身模型来提高算法准确性。推荐算法也不例外,个性化推荐会随着用户的阅读轨迹、用户的行为记录进行反馈优化,逐步提高其准确性。公开资料显示,今日头条每个星期都会对算法模型进行一些优化和调整,近一年内今日头条的算法进行了 4 次比较大的模型迭代。亚马逊在过去二十年间也对推荐系统进行了无数次改进和优化,才有今天非常精准的推荐结果。

    PC 时代的推荐非常原始,无非是拿浏览器里的 Cookie 数据进行关键词匹配。很多人会觉得,现在的算法不也这样么,无非是多了一些用户年龄属性,性别属性,偏好属性,然后套入公式,性别*0.3 + 年龄*0.5 + 偏好*0.2,再加上一些地理位置等属性,就可以进行推荐了。

    实际上,这大概是二十年前推荐 1.0 时代的做法。如今推荐系统建立、使用和优化是一个非常复杂的过程。比如推荐系统的建立方式就包括基于用户、基于关联规则和基于模型的推荐。现在做的好的推荐系统都不会只采用某一种推荐的机制和策略,往往是结合多种推荐方法,以达到更好的推荐效果。

    误区五:推荐算法发展的很快,未来可以洞察人性,无所不能
    推荐算法的出现提高了信息分发效率,很好的解决了信息过载的问题。尽管个性化推荐需要用到一定的用户特征,但都是以公开特征和定向内容为主,很难全面的刻画出一个人,了解人性更是谈何容易。真正做到了解人性,就需要算法比你还了解你自己,以现在的科技水平,算法想要达到科幻小说里的洞悉人性是不可能的。

    更重要的是,任何算法都会有反例。简单说,如果一个分类算法单纯按照头发长短区分男女,有些男生头发比较长就会出现分类错误。作为新技术,机器推荐还有不完美的地方,仍然需优化和改进,这也是众多科学家努力的方向。当然,从比例上看优秀的算法肯定对绝大多数的案例进行正确分类,并有效的推荐给用户。

    误区六:算法都是公开的,竞争壁垒不高
    首先,数据是非常重要的壁垒。真正应用到工业的推荐系统需要大量数据进行建模计算的。并非简单的少量的数据即可,一般情况下需要上亿的数据和上亿的属性特征进行推荐,没有数据只有理论基础都是纸上谈兵。

    因此,如果想要做出一套好的推荐系统模型,需要在大数据的基础上建立非常庞大和成熟的工程师团队。Google、微软聘用了大量的高端人才进行推荐算法优化,无非是针对一些特定的知识点做专门的 Feature Engineering,国内的今日头条也有近半数的员工都是技术工程师。

    一些算法可能会在推荐算法的相关比赛中取得非常好的结果,但并不是说这就是一个最优的算法模型。很可能是机器把样本数据的所有特征都学习到了,获得了过多的局部特征和假特征,形成过拟合。当你用它识别新的数据样本的时就会发现,推荐准确率有可能非常低。

    算法模型必须经过大量数据的学习和演化,没有任何一种机器模型可以被当做权威规则来使用。算法的学习和演化本身也是一种壁垒。换句话说,哪怕张一鸣自己离开今日头条,重新做一套推荐算法,也无法达到现在今日头条推荐算法的水平。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>