为你的下一个项目提供12个开源数据资源

如果你花时间浏览过Reddit的首页,你可能会看到有趣的数据可视化项目。有趣的想法通常是数据专业人士的领域,他们希望用低风险、通常是有趣的方式来展示他们的技能,比如绘制按时间顺序排列的在线搜索关键词,绘制职业篮球运动员职业生涯中每一个投篮的位置,或者绘制身高最高的人居住的热图。
如果你是感兴趣的数据并且想要尝试这些数据分析和可视化项目,您可能会遇到一个常见的问题:寻找免费的、高质量的数据集来使用。
但是不要暂时搁置你的项目计划——开源数据资源可以帮助解决这个问题。这些数据库是在线的,任何人都可以使用,最重要的是,它们是免费的。对于未来的数据专业人士或任何想要完善自己的数据可视化和处理能力的人来说,开源资源非常适合培养你的技能,进行实验,并在你的投资组合中添加有形的项目示例。
找到正确数据源的好处
可获得性和可负担性很重要。但是您还需要高质量的数据资源。“有了开源数据资源,你就可以随时访问高质量、准确、可靠、安全和透明的数据。丹数据中心.“因此,使用这些数据构建的项目将更加高效和有影响力。”
数据的可靠性应该受到高度关注Mobitrix.“结果可能与不准确的信息无关。”
从一开始就使用好的资源也会节省你的时间。McGee指出,在良好的开源数据资源中,合格的贡献者通常已经收集、整理和分析了数据,使您的工作不那么耗费时间。
12个开源数据资源免费提供
无论是健康数据、人口统计信息还是投票结果,这些值得推荐的数据源都可以为您的下一个数据项目提供大量潜在的起点。
1.世界银行开放数据
作为一个拥有海量数据的复杂网站,这个开源资源是很难被击败的。顶部的搜索栏允许您在任何您感兴趣的领域中查找数据。该网站的“更多资源”部分也值得一看。其中一些包括数据可视化,这可能是很大的灵感!
2.世界卫生组织(世卫组织)
任何健康的东西——这个开源数据资源在浏览主题和数据集时都很容易滚动。如果你想要处理与疾病、公共卫生、安全或卫生公平相关的任何领域的数据,你很难要求一个更有信誉的来源了。
3.谷歌®公共数据浏览器
从各种行业和组织中搜索这些数据集。数据浏览器还允许您上传自己的数据集,以创建公共数据的可视化,这为您提供了一个很好的机会来试验如何利用和展示您的发现。
4.联合国毒品和犯罪问题办公室
如果你对有关更多犯罪主题的数据感兴趣,毒品和犯罪问题协调委员会是这些研究领域的全球权威机构。查找关于谋杀、毒品和火器以及非法资金流动和物质使用障碍的数据。
5.AWS上的开放数据注册
这个仓库有数据合作伙伴,如非洲数字地球、Facebook®data for Good、NASA Space Act Agreement和许多其他贡献数据集的机构。该网站为不同类型的数据提供了可导航的关键字和标签,以帮助您通过想要使用的参数缩小搜索范围。
围绕COVID-19数据集和癌症基因组项目的功能也为数据提供了使用示例。
6.美国人口普查局®
人口普查局在商业和经济、健康、就业、住房和人口等主题下提供免费、可访问的数据集。虽然人口普查局的网站可能不是最容易导航的来源,但它包含了大量的公共政府数据。
7.GroupLens
GroupLens是明尼苏达大学的一个社会计算研究库。他们的项目之一MovieLens(一个帮助人们寻找电影观看的网站)为在线现场实验和开源数据提供了活跃的机会。他们包括在网站上访问他们的一些数据集。
8.国家环境信息中心
这一资源来自美国国家海洋和大气管理局(NOAA),旨在为公众提供“国家地球物理数据和信息的宝库”。他们根据学科领域提供数据,其中一些包括地磁数据和模型,海洋地质和地球物理,自然灾害和空间天气。
所有这些都指向更具体的数据库,例如海啸数据库,您可以在其中切换与海啸范围相关的许多不同参数,如被摧毁的房屋数量或海啸的垂直高度。
9.Kaggle®
Kaggle提供的数据集人们喜欢的数据科学因为它很容易使用。您可以通过各种文件类型(SQLite、BigQuery、csv等)找到许多不同行业领域的数据,以满足您的需要。
10.皮尤研究中心®
该组织提供了最大的开源数据库之一。他们的数据来自高质量的调查,涵盖了各种各样的主题。您确实需要创建一个帐户来访问数据集,但该帐户是免费的。
11.Yelp®
正如你所期望的那样,Yelp是一家建立在收集客户评论基础上的企业,它已经积累了大量有趣而有用的数据。更棒的是,他们为任何希望学习数据相关技能的人开放了大部分用户创建的业务评论。如果您想探索关于企业和客户的数据,您可以在这里找到许多可以使用的数据。
12.谷歌趋势®
如果您要查找的数据属于互联网搜索趋势,请查看此数据资源。营销人员和企业——以及想要在这些领域工作的数据分析师——可以从使用趋势词汇中获得巨大收益。浏览他们的年度搜索功能,就可以获得每年在各种主题中最大的搜索类别的快照。
开始数据分析
找到好的数据资源非常有帮助,但就像任何原始资源一样,它的价值取决于您如何利用它。如果您渴望更深入地研究数据分析,那么处理数据项目是一个理想的起点。
如果你正在考虑潜在的项目和如何突出你作为一名数据专业人员的能力,记住雇主正在寻找的技能可能会有帮助。我们的文章”雇主喜欢看到的16种数据分析师技能可以帮助提供一些有用的方向。
Yelp是Yelp, Inc.的注册商标。
皮尤研究中心是皮尤研究中心非营利性公司的注册商标。
Facebook是Facebook, Inc.的注册商标。
美国人口普查局是美国商务部美国人口普查局的注册商标。
