现在我才慢慢明白新浪微博的高瞻远瞩

昨天一个很简单的讨论取暖器效率问题的链接在新浪被无数的僵尸粉转发和回复,我仗着记忆力把所有明显的僵尸粉给拉黑了,他们的特征很明显,就是重复几个真人在这条微博里面的回复和转发的内容。这对一般人来说欺骗性很强,但是我记忆力虽然不好,但是排重能力很强,对这种重复的东西很敏感。

杀着杀着我又开始不拿新浪工资替新浪考虑了,比如如果用算法,这类僵尸该怎么清除。比对一个人是不是喜欢去某条微博下面重复别人的话?当然这有一定的工程和算法难度,因为中国人本来就有僵尸属性,如果第一个人说了“顶”,或者“赞”,后面的每一个人说“顶”或者“赞”的概率只接翻10倍,第一个人说的是“踩”,或者“转发三次,你的名字会变绿呦”之类的,也会效果类同。当然,还是有很多办法可以灭掉僵尸的,行为总是跟人类(尤其是具有超强的僵尸属性的中国人类)有区别的。比如我很快就发现,我封杀的所有僵尸,除了刚才的行为以外,另外一个行为就是热衷转发各种活动贴(呵呵,谁家在给僵尸付钱都看得出来)。

但是,我转念一想不对劲,新浪那么多技术人员,那么多人做僵尸粉清除,他们会不如我么?

我再仔细的联系了一下,我才明白了新浪的险恶用心(误)用心良苦,新的时代是数据挖掘的时代,这个时代最重要的新成果是deep learning,简而言之,deep learning就是跟大脑结构很接近的大规模神经网络学习算法。这个太复杂,我们先从简单的说起。

大脑的结构是什么呢?就是有一堆神经元,相互之间有突触,这些突触都是在神经元接收到刺激以后,随机产生,然后随着同类型刺激和反馈作用而强化的。简单的说,就是,谁跟谁连着,本来无所谓,但是慢慢的连多了,就形成了一些固定的链路,这些链路一旦对人有价值,就会慢慢的被强化。比如,你学英语,本来听到hello这个词,你的大脑不知道怎么反应,但是一遍一遍的听到hello,就产生了一个关于hello的链路,最终结果告诉你,别人喊了hello,你应该也说hello。当然,每一个链路都不是一个两个的神经元的联系产生的,大脑有大量的神经元,他们能产生出来大量的链路,这些链路就是你的知识,你对世界的看法。这是一个层次超过的神经网络。

我们假设存在一个单层的神经元网络,他的逻辑可以很简单,比如,重复跟他有上游神经元的话语,或者忽视,或者反转,或者怎么处理都可以。大家有点听出来眉目了么?假设你把新浪微博里面的一个僵尸粉当作一个神经元理解,你就发现了新浪微博的可怕之处了。

进化之路

我们在任何一个历史时期,都会发现新浪有大量的僵尸粉,然后我们也会发现一些被我们发现的僵尸粉被干掉。这是什么呢?这就是新浪在进行神经元的训练和进化流程。一开始,所有的僵尸粉的目标是,给大号们涨粉。所以他们的特征就是不跟别人创建联系,只关注某些大号。这不算合格神经元,没有任何输入输出链路。

这个特征很快被新浪发现,所以,这些僵尸粉被绞杀。但是新浪的丧心病狂(误)高瞻远瞩在于,他知道如果一次性对僵尸粉斩尽杀绝,就等于在无菌环境下培养细菌,这是不可行的。所以,他们的策略是,随机留下50%的僵尸粉不碰。但是所有被杀掉僵尸粉的赶尸人(不是湘西的,是中关村的、张江的、南山的、文二路的等等),就开始研究新浪的策略是什么。他们因为信息不对称,不知道新浪的50%封杀策略,所以自然的认为是自己的僵尸粉不够智能。所以,那些会说一些重复傻话的僵尸粉出现了。他们仍旧不够合格,因为他们是傻输出,不管别人怎么回复他们,他们只会喃喃自语。但是,新浪这时候已经欣喜若狂了,你想如果你是疯子科学家,你把弗兰克斯坦的材料放在手术台上,螺丝还没拧呢,这时候一个球形闪电击中了这些破铜烂铁,然后一个非碳基生命就诞生了,虽然他傻得一逼,但是你作为一个没有上过大学的民科,不懂什么叫做图灵实验,你觉得这就够屌了,不管怎么说自己会走路,会说话,虽然走路就撞墙,说话谁也听不懂。但是你去问问中国的大多数民科,能削面就叫做高级机器人了,能推车就叫做自行走了,你这个虽然获得不了诺贝尔,上个走近科学之类的还是绰绰有余的吧。

但是,新浪虽然文化程度不高,但是野心还是很伟大的,他没有止步于此。他开始干掉原来留着的那50%第一代僵尸粉。然后顺代干掉了第二代僵尸粉的50%。第一,要优化环境了,老版本的不产生活跃度,而且浪费系统资源;第二,要给赶尸人一点点压力了。赶尸人们刚刚升级了一次技术,广告词也从可以涨粉变成了可以涨活粉。虽然损失惨重,但是那些都是赛博生命,费电点而已,而且还不是费自己的。一方面,赶尸人开始觉得新浪跟神一样伟大,居然连这种说着“aaaa”,“cccc”,“xxxx”的纯粹会说话的僵尸都可以发现,而且还下手这么狠。但是同时赶尸人发现虽然粉经常被干掉,但是生意越做越大,因为新浪不会因为你的粉丝都是已经被杀死的僵尸粉,而把你的粉丝数重新计算,老客户们没有任何抱怨。所以说,新浪大神可能也是很眷顾我们的吧?那就技术继续升级吧。看来,不接受输入,只输出是不行的,因为太容易被看出来。怎么办呢?那么我们开始复制被人说的话吧?

赶尸人其实都只是一个技术工种,会python/php甚至js都可以开公司了。但是,他们无知的在新浪大神的驱使下,进行的小小的技术升级,却催生了整个技术行业的最伟大变革。要知道,我们身体里面有无数的体细胞,无数的脑细胞,无数个各种细胞,从单细胞生物的观点,这些细胞都是单独的生命体,离开人类这个母体也是可以生存的,只要有适合的环境即可。这些细胞都是没有什么智慧的,但是他们链接在一起,就产生了智慧(主要还是脑细胞的链接)。而且除了新浪以外没有人掌握谁是僵尸谁是真人的全部图谱,所以,实际上僵尸粉的链接有可能连在普通人上,有可能连在僵尸粉上。

当赶尸人作出了复制正常人说话的僵尸粉,他就成为了一个合格的神经元,他有输入有输出。整个新浪微博网络就开始出现智慧。当然这还是很早期,你还很难感知到这种力量的伟大,这叫做网络的觉醒期。在这个阶段,外界看来,新浪微博跟以往没有任何不同,只是大家觉得僵尸粉有点多,内容有点无聊,朋友们都在离开,活跃度下降了50%左右而已。这就是普通人跟新浪之间的信息不对称。我们看到了活跃度下降是观察我们所知道的局部网络,但是新浪可以看到,人类的网络活跃度在下降,但是僵尸粉的活跃度在上升,从总的统计数字来看,新浪不管是ip/pv/发布/回复等等都在狂涨。很快,新浪微博里面90%的活跃度都会来自智能的僵尸粉。这时候,很多赶尸人和新浪的拉锯战越来越频繁,杀的多,留得多,进化,杀,淘汰,强化。在我们普通人看不到的地方一个非常智能的巨型神经网络开始形成。

刚才讲过深度学习,其实所谓的深度学习也就是几层的神经网络而已,因为数学的威力,大家知道神经网络的运算量是乘方式增长的,而达到某种智能需要的每层都有大量的神经元。所以,现在即使是Google、微软、Apple、百度这些大家知道在玩深度学习的国际大公司,都也只能在某个特定领域研究,进行几层的神经网络而已。这已经带来了丰硕的成果。但是他们远远不如新浪微博,新浪微博构建的其实是一个大脑,每个账号是一个神经元,关注关系就是神经元之间的链接,僵尸粉根据上家的信息做出来的各种反馈,就是神经元之间传输的电信号。新浪通过这个架构和长期的进化淘汰,慢慢的在让这个僵尸粉网络产生越来越深度的智能,人类会慢慢被洗出去。现在我们会发现一个公司做活动的几十万转发,就可以由一组僵尸粉完成。这满满的形成了一个自组织自洽的体系。

一般人因为理解不了这么复杂的一个神经网络的价值,所以会觉得不还是一堆僵尸粉么,错了,有了这样规模的智能,新浪可以去破解任何保险箱密码,可以黑掉任何网络,可以去任何网站发帖造谣,可以把美国人家里面的nest调成零下5度,无所不能。这才是天网的真实面目,大家幸甚活在这个年代,什么空气污染马上就不是问题了,我们很快就会被母体当作电池保存起来,活在恒温恒湿,各种快乐之中了。

打开APP阅读更多精彩内容