查看原文
其他

学术活动|讲座纪要 吴令飞 词嵌入模型:大团队与小团队所产生的科技创新是否不同?

图书情报知识 图书情报知识 2022-06-09






供稿|倪珍妮  司湘云


科学和技术作为复杂系统,研究经费、研究人员、团队规模、合作者网络、设备资源等因素如何协作、影响和推动科学系统的发展?社会情境对于科学思考有什么样的影响?科学是可扩展的吗?能否通过劳动密集型的方式推动科学研究?探索性的答案就在下文。



7月6日晚,“面向图情档研究问题的研究方法系列讲座(第一期)”第二讲特邀匹兹堡大学吴令飞助理教授进行题为“词嵌入模型与固定效应模型:大团队与小团队所产生的科技创新是否不同”的报告。吴令飞助理教授不仅详细介绍了发表于2019年Nature上的研究成果Large teams develop and small teams disrupt science and technology,更重要地,以该研究为例细致分享了研究实践中的思考与探索过程,包括意象、测量、数据、质量控制、建设性的结论等步骤。吴令飞助理教授表示,研究设计过程中会在问题、意象、方法、数据等之间来回跳转,在研究初期不应局限于具体的点,而应将自己定位于高度不确定的空间,并基于已有研究进行思考。





1  从思考到研究:形成意象

通过意象思考研究问题,将研究问题与研究意象相结合。例如:人类社会在追求科学的过程中,如同在知识的地域中寻找宝藏(想法、方法、解决方案……)。若知识空间地形较平坦,那么适合规模较大的研究团队相互协作,迅速找到最优解;若地形较起伏,则适合若干个独立小团队寻求各自的最优解,最后再比较得出最佳方向与路径。


科学究竟能不能被轻易地攀登?科学是否是可扩展的?科学研究的团队规模?这些问题取决于科学任务的知识空间是光滑或是崎岖。





2  测量

意象形成后,应形成一些指标测量意象,以期得到稳定的模式。吴令飞助理教授团队对学者注意力在知识空间的流动展开了若干年的研究,发现其流动具有分散和去中心性的特征,并以此探测背后的知识空间应是去中心性的空间。


针对“科学是否是可扩展的?”的研究问题,基于已有研究成果,吴助理教授团队发现了一种稳定的模式:2007年一项关于大城市的规模效益的研究,发现团队规模与某种产出呈增函数的趋势。该结论同样适用于虚拟城市。吴助理教授团队继续思考ideas的不同类型(good ideas和disruptive ideas)与团队规模的关系,好的创新与团队规模的关系是否是倒U型曲线?颠覆性创新与团队规模的关系是否是倒U型曲线,甚至是递减关系呢?





如何测量good ideas和 disruptive ideas? 根据引用网络研究的已有文献,发现引用模式大多处于两种极端情况之间——所有引用某一文章的文章都不再引用该文章之前的文章(概率为Pi)、所有引用某一文章的文章都会引用该文章之前的文章(概率为Pj)。概率之差(Pi–Pj)即为颠覆性创新(disruptive ideas)的测量指标。


最后通过案例(cases)证明测量方式的有效性。





3  数据

本研究采集了6.4千万个团队数据,包括论文、专利和软件3个领域的团队行为。





4  质量控制

团队规模和颠覆性创新之间是否存在其他影响因素?例如大团队和小团队的阈值设置、主题因素、学科因素、科学家特征(different kinds of scientists)、历史阶段因素等。


具体地,本研究采用经济学中固定效应模型控制科学家特征(different kinds of scientists)因素;采用词嵌入方法对主题因素进行高精度的控制,以便与回归方法相结合。





5  建设性的结论

数据分析结果表明:小团队的研究更颠覆,大团队的研究更发展。两种模式的背后是两种不同的思维模式,那么这两种思维方式可能与哪些因素有关?


例如:①时间的“回馈”,两种思维方式会导致一种时间上的后果——小团队相比大团队,成果更容易成为睡美人。而时间的“回馈”具有一定的风险——小团队的研究成果需要多少年才能被证明?





②资金支持,本研究进一步抽取论文数据中的“致谢”部分,获取对应文章的基金支持情况,发现在控制期刊因素的条件下,被基金会支持的文章比不被基金会支持的文章更保守,被更多资金支持的文章更保守。每一分投入科学的资金,如果没有以正确的方式进行规划,平均来说,都让科学远离创新。





对于制度的进一步思考:在精英科学向大众化科学转移的过程中,一方面想法、生产力、文章等不断增长,但有多少创新是百年一见的原创性想法,又有多少创新只是在小规模创新或重新组合?将大量资金投入到科研中,获得的科学是什么样的科学?建设什么样的团队,做什么样的科学?这正是需要国家、社会、基金会和学者们思考的问题。


此外,吴助理教授简要介绍了团队正在做的相关研究,例如团队的组织结构对成果创新性的影响,团队的合作关系对学者研究自由度影响,知识的研究、推广、教育、应用等过程的协同关系,科学资本的弊端,知识和技能如何协作进而影响就业等。


最后,参与讲座直播活动的3600多名师生踊跃提问,包括如何定义大团队和小团队、采用引文等结构性的指标做颠覆性测度会不会被质疑、是否考虑用内容做测度等问题。



讲座回放入口:


讲座版权归主办方所有,仅供个人学习,严禁任何形式的录制、传播。一经发现将依法保留追究权。


制版编辑 姚志臻

END





学术活动 | 第六十期 李江  因果推断之倾向值匹配与双重差分:回国后,科研人员的业绩更好吗?

学术活动|第五十九期 讲座纪要 马费成:实证研究的应用及拓展

学术活动 | 第五十八期 吴令飞 词嵌入模型:大团队与小团队所产生的科技创新是否不同?(一项来自Nature的研究)

学术活动 | 第五十七期 马费成:实证研究的应用及拓展

学术活动 | 第五十六期 面向图情档研究问题的研究方法系列讲座

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存