百度指数使用说明书,哈佛可能没看懂

教哈佛大学如何正确使用百度指数。

图片来源@视觉中国

文 | 三言财经,作者 | 江城

“幼儿园——小学——初中——高中——大学——应届毕业生——工作——退休”这是一套最普遍的人生流程,大多数人都在这条直线上一路前进,但是今年却有所不同,疫情突发让很多人不得已暂停下脚步。

高考,或许是大多数人心中的一场人生转折,历年来,高考是挑战也是机遇,但今年6月8高考日却没像以往一样如期而至,各地区纷纷将高考时间推迟到7月进行。

这也使得高考关注度下滑,据百度指数显示,今年6月初高考搜索指数较往年大幅下滑,相信此时的高三学生都在抓紧这最后一个月的机会在努力学习。等高考结束后,学生们就可以放下当下的压力,享受轻松。

如果说高考是第一环节,那选择大学就是第一环节的结果,往年6月到7月是学生关注大学的高峰时时段,但今年搜索指数比较平稳,这说明现在还不是学生关注大学的高峰时段。

第二环节——大学,大学时光匆匆四年,期间你或许选择参加学生会,或许参加社团等丰富生活,也没准成为大学里的“宿舍蹲”,在快乐和挂科中过完四年生活,但是最后的论文可能就成了“拦路虎”。

数据显示,今年毕业论文的搜索指数一如往年,论文怎么写的搜索指数自今年2月起逐渐上升,看来如何写论文,怎么写论文是每届毕业生都会关注的问题。

那么,在这里或许可以探讨一个问题,论文究竟应该怎么写?

百度指数成哈佛论文论据?需要更加科学严谨的引用百度数据

想知道论文怎么写,应该先了解论文的定义:常用来指进行各个学术领域的研究和描述学术研究成果的文章,简称之为论文。它既是探讨问题进行学术研究的一种手段,又是描述学术研究成果进行学术交流的一种工具。

换句话说,论文具有学术性、科学性、创造性、理论性,是学术研究成果,得出的结果都是各种证据紧密关联,可以直接作为论证的观点。

看到这里或许还不知道论文应该怎么写,但是,你会知道论文不应该怎么写,也明白论文不应该是毫无理论的猜测,它建立在科学和理论之上。

近日,美国哈佛大学医学院的一个团队,发布了一个关于新冠病毒的最新调查,称他们通过分析100多张武汉6家医院停车场的图片,以及中国百度的搜索引擎数据,发现早在2019年秋季甚至8月,武汉就出现了一些异常。

哈佛医学院那篇论文里给出的所谓“2019年秋季在百度上检索咳嗽和腹泻的武汉人增加”的证据,其图片给出的时间范围为2018年5月(含之前)至2020年5月。用来推断武汉在去年秋季甚至8月就出现“异常”的核心证据,就是一组搜索数据。

若按照哈佛医学院的论文对于这个曲线图的使用理论,将把时间线拉长一些,把2017年也算入进去,就会自然推翻这个荒诞的理论。

2017年和2018年同期的检索量增加的数较2019年还要高。按照他们的逻辑,这恐怕要说明2017年、2018年武汉就出现“异常”了?

对此,百度回应称,近日哈佛大学医学院发布论文,从武汉医院附近交通车流量和百度上关于“咳嗽”与“腹泻”的搜索数据来得出关于病毒的结论,这是非常牵强和不严谨的。

事实上,武汉地区“咳嗽”的整体搜索量峰值跟每年的流感季是吻合的,而“腹泻”的搜索量与往年相比并没有明显变化。同时,百度指数显示,2019年12月左右“腹泻”搜索量还有轻微的下降。

百度呼吁相关研究需要更加科学严谨的引用百度数据。

这样的证据实在是站不住脚,而百度指数却被他们实实在在的“玩坏了”。

哈佛大学的操作让人联想起不同类型的顾客对于商品使用说明书的态度。

第一种顾客拿到商品后,仔细看过使用说明书,明白了商品用途。

第二种顾客拿到商品后,不看使用说明书,聪明的摆弄一下便明白了商品的使用原理,而不聪明的怎么弄也弄不懂,摆弄了半天之后只能去看使用说明书。

第三种顾客是看不懂使用说明书,但经过商家讲解之后,知道了如何使用,而有的人却听的一知半解,还有顾客不屑去听。

还有第四种顾客,明明清楚使用说明书的用法,但是却装作不懂,在进行一番操作之后把商品弄坏了,却反过头来找商家碰瓷,说商品就是本来就是坏的。

这么看来,不知道哈佛大学是如何看待百度指数的使用说明书的,又是第几种顾客呢?

那么如何正确、全面使用百度指数?

百度指数是以百度海量网民行为数据为基础的数据分享平台,是当前互联网乃至整个数据时代最重要的统计分析平台之一。

那么,哈佛大学引用百度指数数据不正确的地方是哪里?

并非百度指数数据不正确,而是哈佛大学不应该将咳嗽、腹痛等数据和新冠肺炎联系在一起,这是毫无根据的,有强行关联的嫌疑。且向前推算数据,2017年和2018年同期的检索量增加的数较2019年还要高。

这个被哈佛大学当作核心理论的数据,只要在百度指数上修改扩展下日期就被轻松推翻。

所以通过百度指数去求证、证实一件事情,不能光引用某个时间点的数据,还需要在一定时间的跨度、去比较比对这件事是孤立事件?还是重复发生的。

那如何才能更加全面展现百度指数数据呢?

首先可以通过“一词+多时间点”查询指数:用户可以自定义时间查询不同时间段的关键词信息。输入关键词即可查看对应的指数数据。

其次,可以“多词+多时间点”查询:在单个或多个时间点的跨度上,输入多个关键词,可以查询它们在不同时期相同时间点的数据表现及对比。

曲线图上会用不同颜色的曲线加以区分。如检索“论文、论文查重、论文怎么写、大学、答辩”。即可对比不同关键词在不同时段的搜索热度,得出相关时段大学生学业上关注的重点。

目前,百度指数最多支持5个关键词的比较检索。

第三,还可以实现不同关键词数据相加,如搜索“大学+论文+论文查重”,可以将若干同义词的数据相加,更加精准的寻找到需求数据。

目前,百度指数最多支持3个关键词的累加检索。

百度指数除了趋势研究外,还有需求图谱和人群画像功能。

需求图谱可查看搜索热度,相关词热度榜单一目了然。

人群画像可查看省份、人群属性、兴趣分布,各省份搜索指数排名清晰明了,还可以查看不同年龄、性别对关键词搜索占比。

自今年以来,伴随疫情发生,宅家上网的人越来越多,热词、关键词从口罩到头盔,被称作“劈头盖脸”的一年,数据搜索量一方面体现了人们对于各种商品的需求量,另一方面也代表着当下热点。

除了人们的需求外,还有对生活质量以及生活便利的关注,不同时间段的热点搜索高峰都有所体现。如丰巢快递柜修改收费政策后,搜索指数一路飙升。

回到哈佛的论文上,它犯了重视数据、却没有正确重视数据的错。如果它能够正确使用百度指数,就会得出完全相反的结论了,好好学百度指数的正确使用,它会修改报告结果吗?

打开APP阅读更多精彩内容