跳到主要内容。

使用此逐步的数据指南来编制社区中的鸦片样品疫情

工艺:来自现场的课程

使用此逐步的数据指南来编制社区中的鸦片样品疫情

博客身体

[照片:John Moore / Getty Images]

目前已被广泛承认,阿片类疫情一直在整个美国席卷社区。虽然俄亥俄州或西弗吉尼亚如诸如诸如俄亥俄州或西弗吉尼亚州的最艰难的州往往抓住全国头条新闻,但成瘾已经达到了这个国家的每个角落。

在2016年,我开始了解阿片的影响力如何影响圣地亚哥县。我这样做了,使用数据和访谈与专家和人们在与海洛因和处方药中的战斗中的前线。我发现的是年轻人,经常是白色的,在以前未曝光的相对富裕的社区中的数量越来越多地灭活了阿片类药物过量的蹂躏。

县验尸官或医疗审查员办公室是关于阿片类药物报告的关键数据来源。在我的案件中,我要求在过去的15年内从San Diego County Medical Cateiner的办公室提供过量死亡,包括人口统计和地点信息。我用它来创造一个 可搜索地图 在圣地亚哥县邮政编码中每10,000名居民与阿片类药物有关的死亡。我还创造了一个比较的互动 阿片类药物过量的人口统计 对整个县的受害者以及从其他药物如可卡因和甲基苯丙胺等药物过量。

在本指南中,我将解释我如何获得数据,然后我会通过如何分析来自县的体育审查员办公室的数据的一步一步逐步的教程。这包括如何映射数据的提示,使读者可以看到在给定的区域或县中发生死亡的位置。

当您在您自己的社区进行这种数据分析时,重要的是要记住报告应该是数据的,但人类驱动。在我的情况下,这意味着讲述Mark Gagarin和Aaron Rubin的故事,毕业生来自Poway High School的毕业生,他们以自己的方式沉迷于强大的阿片类药物。成瘾的斗争的故事提供了使这种报告有意义的人体元素。

工具

对于本指南,我主要使用 微软Excel. 清洁和分析来自各种状态和本地来源的数据。大多数工作也可以使用Google Shills完成。

映射数据我将使用 Google Fusion表格,任何具有Gmail帐户的人提供的免费工具。第一次使用者可能需要 启用 在使用之前的在线应用程序。

最后,虽然在本指南中未涵盖,但在我自己的报告中我使用过 画报 创建数据可视化。 Tableau提供免费选项,调查记者和编辑组织的成员可以免费获得付费版本。根据个人需求和新闻室规格,其他可视化工具包括 高级园林plot.ly. and infogr.am.

请求数据

医学审查员(或某些县的验尸官)通常对您所在地区的过量死亡有丰富的知识。利用他们的数据可以帮助照明值得注意的趋势。

在与My County的医学审查员的发言人对话后,我提交了一份加利福尼亚州的公共记录法案请求以下信息:

“因毒品的意外死亡&药物/药物从2000年到最近在内的邮政编码位置,药物/药物,药物/药物,毒品/药物的药物,性别,年龄,种族/种族分类。“

这是值得在这里讨论的原因 邮政编码 用于定位分析。邮政编码很容易理解,当地人通常会对它们所代表的邻居具有好主意。它们也使用普遍使用 - 邮政编码92104将意味着数据来自当地,州或联邦政府的相同区域。

然而,他们确实有一些缺点。他们并不总是与城市或社区边界完全匹配。虽然它们通常包含统计上大量的居民,但任何一个邮政编码可能有几百居民之间的任何地方和40,000。

这是原始数据看起来的样子:

 

要使用此数据,我们需要标准化物质名称(确保拼写对于所有物质都是一致的)和年龄(删除单词“年”并在第8行中调整“1天”)。我们还将添加物质类别,因此我们可以将如类毒素,海洛因或可待因组分组。我们也会 删除重复项 所以一个人没有被过度计数(例如,行5和6是同一个人,具有相同的案例编号)。

最后一步尤为重要,因为人们经常死于药物的组合。电子表格中的每一行都是该人毒理学报告中出现的药物之一。个人由他们的独特案例编号(或列标题中的Casenum)识别。

要开始,我们将摆脱“年龄”列中的“年”文本。这将允许我们根据受害者的年龄来分析数据,例如平均年龄,年龄组等。

首先,将新列插入“年龄”列的右侧:

 然后,选择“年龄”列:

在Excel菜单中的数据下,选择“文本到列...”

这将使“文本到列”向导,将您通过其余步骤的步骤。对于原始数据类型,选择“分隔”。

对于“分隔符”选择“空间”,然后单击“完成”。

这将使用数字和“多年”作为断裂点之间的空间分为两个“年龄”列分为两个。例如,“46年”变为“46”和“年”。

为了清楚起见,我将原始专栏重命名为“年龄”,并且将经历各个年龄在几天的情况并将其变为零。因此,在1天后死亡的人将在数据中标记为0年。然后我删除了现在不必要的文本列,所以它看起来像这样:

下一步是向数据添加物质类型类别。不幸的是,这必须手动完成。这是最耗时的步骤,而是一个用于分析数字的重要人物。一个快捷方式是按“物质”列对数据进行排序。这将至少连续显示所有相同的物质。这是A. 快速底漆 on sorting in Excel.

最后,这里的数据应该是如何看的:

接下来,我们将创建一个新的工作表,只有鸦片样品过度使用。然后,我们将从该新表中删除重复项。

首先,通过选择Excel工具栏顶部的过滤器按钮为表创建筛选器。这将为每列添加一个小下拉菜单箭头。 (在Excel中找到更详细的过滤说明 这里。)

然后,选择“键入”列,然后在新过滤器菜​​单中取消选择除“鸦片”之外的所有内容。

选择剩下的所有内容并将其复制到新工作表中。这是我们将删除重复项的地方。选择新表中的所有内容 - 我标题为“鸦片样品”,以更好地跟踪它转发 - 并点击数据子菜单下的“删除重复”:

这会带来一个小小的弹出菜单。除了“列A”之外取消选择所有案例编号。这将告诉Excel查找具有相同案例编号的任何行。如果两行匹配,它将删除其中一个。

关于这一步骤的一个重要说明:由于这种去除重复的行为随机删除了一些个体的一种或多种特定药物,不要对“物质”柱进行任何分析。例如,如果您究竟想知道从海洛因过量的人死亡,请返回原始数据,这将包括重复的数据。

我们将在此数据上运行的第一次分析是通过年龄组对数据进行分组。为此,我们将使用Countifs公式。首先,确定您要用于分析的年龄组,例如0到10岁,11到20等。我与五年组(0到5,6到10,11至15等。 )因为它们与人口普查的用途匹配。

首先,我写出了我的数据所需的范围。 (我专门为此创建了一个我的表型电子表格的副本,以保持我的数据清洁。)对于第一个年龄组,我使用了以下公式:

= Countifs(E2:E3490,“>=0",E2:E3490,"<=5")

在这种情况下,E2:E3490是“年龄”列中的行范围。第一个标准,“>= 0“告诉Excel计算该行,如果它的数字大于或等于零。第二条标准,“<如果数字小于或等于5,则判断出Excel计算行。数字必须满足要计算的两个要求。

使用此公式时,请记住在每个标准之前包含两次两次。确保所有总和保持相同的范围始终是很重要的。 (您可以在Countifs公式上找到更多信息 这里。)

接下来,我们将使用枢轴表来确定阿片类药物过量受害者的崩溃,通过种族/种族和性别来实现。您可以找到更详细的枢轴表 这里,但基本上他们允许快速的复杂数据集摘要。

首先,转到您删除重复的opioid的电子表格过量受害者。在数据子菜单中,单击“数据透视表”旁边的下拉菜单箭头,然后选择“创建手动数据透视表...”。

这将显示一个弹出菜单,该弹出菜单将检查您希望枢轴表进行分析的范围,在这种情况下是整个工作表。它将在新工作表中创建枢轴表。这应该是菜单上的默认设置,因此单击“确定”以创建。

这将创建一个带有空白表的新工作表和标题为“数据透视表构建器”的新弹出菜单。我们将首先查看性别分解,使“性别”拖到“行标签”框中。我们希望性别的个人数量,使“Casenum”拖到“值”框。

遵循与“RACE”相同的步骤标签框显示过量导致受害者的崩溃,通过种族和种族。

当您创建新的工作表和枢轴表时,它很好的做法是清楚地标记所有工作表。这将有助于确保您按照日复一日或几周后保持数据。

在您进行此分析时,还要考虑数据的历史范围。您想知道过去15年的过量受害者的性别细分吗?或者只是过去五?看着太大的时间窗户可以隐藏持续的趋势,而过于狭窄的窗户可以通过随机变异容易地倾斜。查找最佳作品的时间段为您的分析,并在呈现数据时清楚地清楚。

将过量数据与整体区域人口统计数据进行比较也可以提供有价值的背景。例如,您可以确定与整个县相比的过量受害者的份额。对人口统计数据的好来源是 censusreporter.org.。本网站易于阅读图形,并提供来自美国普查局的原始数据。

人口普查记者通常从2015年五年的美国社区调查中推出,这比完整的人口普查更为近,但更准确。根据您的数据多大了,您可能需要考虑使用2010年二年人口普查数据。

映射过量死亡

此报告的最后一步将通过邮政编码映射过量死亡。对于这个例子,我专注于2007年至2015年的死亡,每10,000名居民调整。这将为我们提供足够长的时间窗口,从我的报告表明阿片类药物开始增加的时间开始。

首先,我在Excel中创建了一个新的枢轴表,这次是行标签框中的“邮政编码”。在值框中,我再次拥有“casenum”,我添加了一个新变量:在“年”列标签框中。

这给了我一个表,其中每列是通过邮政编码给定年份的OpioID的过量死亡人数。然后我将增加2007年至2015年的死亡人数。为了简单,我也将向新工作表移动这张表的内容。

为此,我们将使用SUM公式,该公式在给定范围内添加单元格的内容。我使用了以下公式:

= SUM(I3:Q3)

这告诉Excel从第I列中的第3行中的每个数字添加到列q,这是第12栏的。在这里,您可以看到此分组的另一个有价值的方面。从2000年到2006年,这个邮政编码中有三种阿片类药物死亡,91901。从2007年到2015年,有12个。

通过在组中添加多年来,我们可以更准确地比较单个社区的药物死亡的变化随着时间的推移。它还有助于减少单年增加或减少,因此我们的数据分析更准确。

一旦我创建了新的总和,我将把结果(邮政编码和2017年到2015年的死亡)移动到Google Sheets工作表。我还添加了人口数量和其他一些人口统计测量措施。

您可以使用以下公式确定每10,000个居民的死亡人数:

= 2007-15 /(人口/ 10,000)的过度数量

然后在Google Drive上,我创建了一个新的Google Fusion表文件。这把我带到了一个新的窗口,一个菜单要我选择一个表。

我从左侧菜单中选择了“Google电子表格”,并选择了每10,000名居民死亡的表。这向我展示了数据的预览,然后我点击了“下一步”。在下一个屏幕中,我给出了我的桌子一个名字。不要担心在此步骤中为Fusion表进行详细描述 - 我们正在使用此表稍后创建第二个表。

此表显示了来自overdose电子表格的数据。这拥有所有数据,但它没有Google Fusion表需要映射数据的地理信息。我将要做的是,使用一个融合表合并此数据,该数据具有加利福尼亚州的每个邮政编码的地图信息。

我点击了表左上角的“文件”,然后选择了“合并...”

这将要求我选择一个表来合并。在弹出菜单的底部,有一个选项可以粘贴Web地址。我在那里复制了以下地址: //www.google.com/fusiontables/DataSource?docid=1sI5oMIIywb1q-LwazKCthfxnwGNWhsnwsHudZCaa

这将我带到一个新表,让我列出了一个列表将与新表中的列匹配,称为zip_ca.kml。我将我的邮政编码列与名为“ZCTA5CE10”的融合表中的可比列匹配。

 一旦完成,我点击下一步。下一个菜单让我选择要合并的列。我选择了所有这些并单击“合并”。这创建了一个全新的表格,所以我点击了“查看表”来转到它。

在新表中,我点击了“几何图形映射”选项卡,以查看新地图。这应该显示填充的区域中的所有邮政编码。

在左手菜单上,“更改功能样式...”可以根据过量比率调整颜色。单击它将显示一个新的弹出菜单。在那里,在“多边形”和“填充颜色”下,我可以确定我想要使用什么样的颜色,无论我想要梯度或桶等。

例如,具有每10,000名居民死亡人数的列上的渐变可以使其成为邮政编码更越越高,比率越高。

查找有关不同颜色样式的含义以及如何为您想要调整它们的更多信息 这里。当您确定颜色时,查找可能使颜色范围毫无意义的异常值并相应调整您的范围。

“更改信息窗口...”按钮将显示弹出菜单以调整单击特定邮政编码时出现的信息窗口。了解如何调整这些 这里.

在发布之前花一些时间在地图上调整颜色和信息窗口,以确保它对于读者来说是清晰和有意义的。在“文件”下选择“关于此表”以调整表的名称,数据源和描述。

当您准备发布自己的地图时,请单击“工具”下的“发布...”。确保您的Fusion表的可见性设置为公众。此弹出菜单还将为您提供所需的代码,您需要在您的网站上嵌入此地图。

要考虑的事情

在您自己的数据上工作时,您可以采取一些步骤以确保分析的准确性。在分析开始时,始终将数据的原始副本放在一边。如果您需要返回并重新执行某些操作,这很有用,并确保您可以复制您所需的任何步骤。

始终维护数据日记 - 要点是电子表格,文档或笔记本,您可以在其中记下您使用的商品和步骤以操纵数据。您应该能够向别人提供原来的数据和这日记,他们应该能够获得相同的数字和结论。

据怀疑地联系到研究人员或其他数据记者,如果您正在做的事情,请询问他们。调查记者和编辑(IRE)和国家计算机辅助报告研究所(NICAR)有集团的记者电子邮件,他们可以为您提供建议和新的一副新闻。即使是您的医疗审查员的办公室也可能拥有熟悉数据的研究员,谁能为您提供一些关于您的分析的指导。

即使不是所有的分析和图形最终在您的最终故事中最终,这项工作也将为您的报告提供宝贵的背景和强大的基础。

[照片:John Moore / Getty Images]

公告

在这个网络研讨会中,我们将分享我们去年首次抓住头条新闻以来我们已经了解的关于长Covid的内容,我们将讨论如何告诉知情和引人注目的故事,了解了上升的医疗状况在全国各地的几乎每个社区都有预算。 在此注册!

厦门IC暴力每年都会影响数百万美国人。 然而,媒体网点大多将事件视为“警察”项目,如果他们完全涵盖它们,而不是将家庭暴力视为公共卫生问题。我们的免费为期两天的研讨会将帮助记者了解根本原因和预防,干预和治疗方法。再加参与者将能够申请赠款来报告加利福尼亚侧重的项目。

跟着我们

Facebook


推特

chj图标
报告Health.