去年起,国内悄悄刮起了一股 NHANES 数据挖掘的浪潮,目前全球范围内大概有 6.5 万篇文献与 NHANES 数据库相关,其中有近 2000 篇数据直接使用 NHANES 数据库的数据发表。
这些文章中不乏 30 分以上的高分文章,但发表年份多早于 2019 年;近些年发表的文章大多在 2-5 分这个区间,近两年平均每年发表的文章数在 200 篇上下。
由此可见,如果把 NHANES 数据库比喻成一座金矿,先行开采的人一定优先选最大块的黄金挖走,后面来的人只能挑前人剩下的,等到最后一批就只能筛点金沙了。
但好消息是, 按照目前 2000 多篇的发文量来说,NHANES 数据库的潜力还是巨大的!因为——
NHANES 数据库中的数据够全够多!
「全」
NHANES 数据库包含有两大模块的数据,通过问卷、实验室检查、体格检查等各项数据,构建了一个具有巨大科研潜力的综合临床数据库。目前已进行 11 个 Cycle 的调查,收集 264 个不同主题的数据模块,拥有近 1400+ 分析量,可以覆盖大部分临床科室的选题。
「多」
NHANES 数据库自从开始于 1960s,从1999年起开始连续性地进行,每年抽样 5000 人进行全国范围内的统计,现已完成 11600+ 人群的数据调查。
更难能可贵的是,该数据库两年都会更新一次数据,因此每过一段时间,都可以再从 NHANES 数据库中找到有价值的结果进行发表,可以说是一座可循环利用的金矿。