另一个更好地衡量创新的潜在策略是使用网络数据“预测”商业创新。例如,可以进行一项大型调查来衡量商业创新,然后在其他更及时匹配的数据源(如受访者的网站)中寻找这些指标的良好预测指标(用机器学习的语言来说,我们将在通过调查标记的数据集中训练模型)。然后,我们可以利用我们所了解的代理和指标之间的联系来估计我们尚未调查的其他企业(但显示创新“信号”)具有创新性的概率,并比大型和昂贵的调查更快、更频繁地跟踪情况的变化。
其次,我们需要找到一种方法来开放目前封闭的重要创新数据集。这适用于公共部门,他们几乎默认应该开放参与创新计划的公司数据(这是英国创新局已经通过研究门户做的事情),以及企业注册,甚至在合理范围内开放管理数据集。专门为创建高质量数据而设计的政府干预措施,例如创新增长实验室倡导和运行的干预措施,是这一组合的重要组成部分。
在私营部门方面,GitHub、Meetup 或 Twitter 等一些平台对其数据相当开放,可以通过开放的应用程序编程接口 (API) 访问。其他平台(如 LinkedIn)的数据为研究劳动力流动、商业网络和创新能力提供了绝佳机会,但这些数据仍处于封闭状态。
是否有任何法规、激励措施和技术系统(包括通过安全数据服务共享数据)可以制定,以鼓励更系统地共享这些信息,为创新和经济政策提供信息?
第三,我们需要整合数据集,以获统一视图。如果苹果的 App Store 中存在有关内容创新的数据,GitHub 等协作编码网站中存在有关数字创新的数据,Glassdoor 等求职评论网站中存在有关组织创新的数据,我们如何全面衡量创新?
为了有效地合并所有这些数据集,我们需要唯一的标识符 RCS数据 来告诉我们 GitHub 上的创新型初创公司 X 与参与创新计划 Y 和加速器 Z 的初创公司是同一个,这与科学中已经存在的标识符一致。
政府和数据平台还能采取更多措施来鼓励采用像 GLEI 这样的企业标识符吗?那么,个人创新者的唯一标识符呢?例如,它可以帮助我们追踪他们的轨迹,绘制思想传播图,并衡量创新计划的长期影响?在这方面,我们可以从公共部门解决方案开始,比如个人身份证号码,它使北欧国家进行了大量伟大的创新研究,也可以从私人解决方案开始,比如 LinkedIn 或 Twitter 等社交媒体平台上的用户 ID。
结束语和警告:指标仅仅是个开始
我们需要更多、更好的数据来制定创新政策,我相信上述议程在科学计量学的进步的启发下会有所帮助。然而,为了产生影响,我们开发的新指标需要得到使用,而且要明智地使用。
也许正是在这里,我应该缓和一下我对科学领域现状的乐观态度,学者们长期以来一直对痴迷于指标以及简化的影响因子或大学排名的过度和扭曲影响表示担忧。世界的复杂性将永远压倒我们绘制它的能力,科学、技术和创业创造力所固有的不确定性将永远阻碍我们预测和控制它的愿望。
然而,无知并非福气,很少有人会认为应对所有这些挑战的办法是停止测量。答案是继续测量,更好地测量,谦虚地测量,了解指标的局限性,边学边用,并运用我们所学的东西。