本博客是AYLIEN NEWS API系列的一部分:Python用户入门指南。您可以查看Jupyter Notebook学习者文档在这里

新闻情报可以帮助大型组织及早识别风险和机会,使他们能够在需要时迅速果断地采取行动。通常情况下,我们所需要的只是一个新闻报道,一根大海捞针,就能触发警报或发现市场缺口。

但是,新闻的庞大数量和持续不断的性质,使得我们需要在确定有必要深入分析单个新闻故事的细节之前,从总体上分析数据。就其本质而言,一些文章将涵盖相同的事件和涉及相同的信息。因此,有时我们希望在宏观层面上查询新闻并分析总体趋势,而不是查询细粒度的故事。

AYLIEN的Timeseries端点使我们能够做到这一点。有了这个端点,我们可以跟踪故事中所包含的数量值随时间的变化。这些信息可以是对某个主题或实体的提及,对某个主题的看法,或某个来源发布的故事数量,等等。提取聚合Timeseries数据也比查询故事端点并批量返回单个故事更快,然后对它们进行处理,以度量每篇文章中包含的实体、情绪等的出现情况。

查询Timeseries端点

Timeseries端点检索符合我们的搜索标准的报道,并按分钟、小时、日、月或您认为合适的时间进行聚合。这对于识别与感兴趣的主题相关的新闻量的峰值或下降非常有用。默认情况下,AYLIEN的新闻API会汇总每天的新闻数量。

Timeseries查询的输出是一个嵌套的JSON对象,它在数组中列出了每天的报道量。我们可以将其转换为Pandas数据帧,使其更容易被人眼识别。

可视化Timeseries

可视化时间序列数据是识别峰值、异常或其他感兴趣点的一种快速而有效的方法,也是使用粒度故事识别进一步调查领域的一个很好的跳板。

然而,在深入研究故事的细枝末节之前,我们可以在每个感兴趣的时期确定一个故事,以便我们了解新闻报道的背景。使用Stories端点,我们可以提取相应时间段Alexa排名最高的故事。将本文的标题添加到图表中,可以很好地指示内容的重点。Alexa排名是对一个网站在互联网上受欢迎程度的估计。了解更多关于与Alexa排名的工作在这里

Timeseries和Stories端点的这种使用结合起来形成了一个简单而有效的工具包,用于快速分析新闻报道。看看我们是如何用时间序列来分析美国民主党候选人的报道的在这里

根据情绪拉动时间序列

在媒体监测中,情绪分析是追踪品牌情绪、活动成功、公共关系和监测危机的宝贵工具。它可以成为公众舆论的严峻考验,也可以成为人们如何看待一个主题的重要指标。

通过Timeseries端点,我们可以聚合符合搜索标准的故事,并对它们的情绪进行整体分析。虽然AYLIEN的新闻API将文件和实体分为正面、负面或中性情绪,但专注于两极分化的正面和负面故事只能让我们更好地判断一个主题是被从正面还是负面的角度看待。

看看我们如何使用情绪分析和时间序列端点来分析Brexit而且奥斯卡获得提名的电影受到媒体的欢迎。

本博客是AYLIEN NEWS API系列的一部分:Python用户入门指南。您可以查看Jupyter Notebook学习者文档在这里

本系列的其他博客:

入门指南1:AYLIEN的故事对象——自然语言处理丰富和如何使用的入门

入门指南2:精炼您的新闻API查询

初学者指南4:如何使用新闻API趋势端点

初学者指南5:初学者指南5:如何使用新闻API集群端点

开始免费试用

消息灵通

我们会不时地通过电子邮件与您联系我们的产品和服务。