皮尤研究中心的实验室的数据团队使用计算方法来补充和扩展中心现有的研究议程。188金宝搏官网入口该团队收集文本、视听和行为数据集;使用创新的计算技术和实证策略进行分析;并产生原创研究。数据实验室还探索了这些数据和方法的局限性,并致力于建立使用和分析的标准。188金宝搏官网入口

数据实验室项目既产生自己的报告,也与中心的其他研究小组合作,将新的计算方法应用于现有的研究问题。过去的研究探索了国会的沟通,调查了美国人的使用方式社交媒体,并从视频年代和图片算法的偏见而且宗教的言论.数据实验室团队还写了关于计算社会科学研究的过程解码是该中心关于研究方法的幕后博客。188金宝搏官网入口

此外,数据实验室管理中心的计算基础设施。这包括建立高性能计算系统和数据库,以促进网络数据的收集和处理;部署在R和Python中促进协作性、可复制性分析的平台;开发系统来自动化研究任务,比如机器学习的内容分类。

正如皮尤研究中心(Pew Research Center)作为一个整体一样,数据实验室是无党派的,不倡导任何利益。团队重视独立、客观、准确、严谨、谦逊、透明和创新。

查看数据实验室的最新研究

为什么皮尤研究中心要创建数据实验室?

“数据实验室”的创建是为了应对人类行为和态度数据的本质变化。公众正以前所未有的方式在网上表达观点,并留下行为的电子痕迹。我们现在可以了解人们在社交网络上与谁联系,他们搜索什么,他们发布什么内容。与此同时,机构和团体正在利用互联网向不同的受众传递信息,邀请研究人员观察他们发布的内容以及人们的反应。

虽然其中一些交流和行为的数字痕迹是非结构化的,不适合以原始形式进行分析,但一些新技术正在使收集和处理这些数据变得更容易。这些技术包括:

  • 互联网数据收集:这包括收集网页内容和解析字段(例如日期、名称、链接和表格)以进行分析,以及在线查询api以获得格式化数据。
  • 自然语言处理(NLP):这包括处理文本以测量概念和提取模式。
  • 机器视觉:这是指使用计算模型来分析图像,以估计图像所描述的内容。
  • 在线分布式劳务平台:这些平台可以将主要的数据收集工作分成一系列小任务,然后由外部人员完成。这有时被称为“众包”。

Data Labs是这些数据源和分析它们的不同方法的试验场,其目标是通过创造性的设计、创新的方法、周到的测量和合理的部署从数据中提取意义。188金宝搏官网入口

数据实验室团队还采用了在整个中心中磨练出来的方法,例如内容分析调查实验的分析开放式调查回复

数据科学

其他研究方法188金宝搏官网入口

Baidu
map