查看原文
其他

使用开放数据和谷歌搜索数据进行竞争情报分析

kiki 情报分析师 2022-07-18

【背景】当今社会,开源数据在我们的工作中发挥着重要作用,是非常重要的数字化转型趋势。此外,它已成为业务分析、洞察力和战略计划等商业实体活动的重要组成部分。

【过程】首先,本文利用欧盟最先进的开放人类医学数据中的抗抑郁药数据,选择捷克共和国作为主要研究领域。其次,利用一种新的上下文分析方法分析医药数据和谷歌搜索数据,我们确定了竞争情报和开源情报的关系。

【结论】最后,本文展示了深网数据在竞争情报分析中的重要性,其与网数据相结合的分析方法对医药行业具有高价值、低成本的特点本

介绍

在本文中从两个角度关注了开放人类医学数据:政府和企业。在这两种情况下,我们都希望为公共部门设计开放数据智能分析方法,例如。决策者、部长、委员和其他关键人物。我们的政府方向是建立最佳的开放数据结构,我们的业务方向是复杂的业务环境分析。为了证明我们的意图,我们选择了以抗抑郁药为重点的开放人类医学数据。为了增加特异性,我们增加了谷歌搜索数据视角,以获得我们分析的地域维度。我们的两个主要研究问题是:开放数据能否在制药行业内提供重要的竞争情报见解?表面网络搜索数据能为匿名开放人类医学数据提供地域视角吗?

医学数据结构

我们分析了欧盟、瑞士、挪威和土耳其负责监管和分发政策的国家控制机构的数据可访问性。当我们联系每个机构时,我们收集了关于响应时间、内容相关性反馈水平和人为因素的信息,这些信息基于他们在请求的数据收集方面提供帮助的能力。我们意识到这项初步研究的结果严格来说是定性的,可能会产生误导,因此我们将研究的时间范围扩大到了三个月。电子邮件通信已被选为第一种联系方式,然而,在特定情况下也需要电话通信。其次,我们研究了所有可能的信息来源。官方网站、存储库和FTP服务器,并监控开放的人类健康数据集是否可用,以及如何按照其格式进行处理。如果数据集不在线存在,我们将注意力集中在搜索系统界面上,该界面可用于生成具有所需数据字段的数据集。如果没有证据表明存在开放数据,我们会联系负责沟通的人员,收集关于开放数据政策状态的信息。

谷歌数据结构

我们的目的是验证我们的开放人类医学数据CI市场分析结果的过程。如果我们能够获得关于制药公司的详细市场数据,我们还需要添加地域信息,这是至关重要的,因为开放的人类医学数据是严格匿名的。通过谷歌趋势应用程序数据,我们能够挖掘surface web用户的信息搜索行为,并获得以下数据实体:
  • 追溯到2004年的搜索利率

  • 搜索者的地域来源

  • (地区、城市)

  • 与我们期望的术语相关的趋势关键词

  • 我们已经将谷歌搜索数据集结构化如下:

  • 国家

  •  搜索词(给定国家语言和英语中的关键词抗抑郁药)

  •  周(在特定年份)

  • 给定国家的搜索次数

  •  地区

  • 给定区域中的搜索次数

结论

开放的人类健康数据可以被认为是竞争环境分析和显示大地理区域特定健康趋势的重要信息实体。有两种情况可能导致这种可能的使用。首先,数据必须遵循具有明确定义的变量的一致结构。其次,数据集必须包括分类代码,以发现特定的药物或活性成分。在为期三个月的欧盟成员国数据收集期间,我们在数据综合方面面临重大障碍,主要是由于信息服务不佳,开放人类医学数据结构和质量存在显著差异。最后,我们能够展示以捷克抗抑郁药市场为重点的开放数据CI分析。因此,我们的第一个研究问题得到了证实:开放数据及其背景分析为特定国家带来了情报我们的第二个研究问题集中在开放医学数据的地理方面。首先,医学数据是严格匿名的。没有一家机构提供地理定位数据集。我们决定使用信息寻求行为数据,并显示抗抑郁药消费的可能地理背景。我们使用了谷歌搜索数据和相关的关键词,包括“抗抑郁药”作为一般术语和药物的具体名称。分析表明,谷歌搜索数据与开放数据分析揭示的市场趋势相关,但由于谷歌搜索数据样本较小,地域洞察力在这种情况下并不显著,仅提供了一般的区域概述。为此,我们认为第二个研究问题有待证实。


本期编辑:kiki

如有侵权,请联系管理员删除

通过“情报学院”知识星球可以阅读该资料的全都内容👇



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存