当我们在线搜索或监控新闻内容时,我们会指定我们感兴趣的人、组织或事物,以便返回相关的故事。但有时,我们不能列出每一个我们感兴趣的东西来搜索内容。例如,想想你很难做一个全面的查询来搜索关于以下的新闻故事:

  • 所有宣布新研究项目的大学,
  • 自然灾害对世界上每个证券交易所的影响,
  • 每一家宣布c级职位变动的公司

从技术上讲,你可以通过列出世界上每一所大学或每一家股票交易所的名单来搜索新闻,但这将是非常低效和耗时的。为了进行这些查询,我们需要一种方法来查找关于整个类的事物的故事,换句话说,就是故事实体类型.幸运的是,News API提取了这方面的信息。在本博客中,我们将向您展示如何利用实体类型进行智能搜索,为您提供满足您需求的内容,即使这些需求没有明确定义。

什么是实体类型?

每当News API收集和索引一篇报道时,它所分析的许多事情之一就是报道中讨论了哪些实体。它通过识别文本中提到的人、公司和其他事物的位置,然后为它们找到正确的DBpedia资源来实现这一点。这不仅使我们能够理解所谈论的确切实体(无论提到“苹果”是指水果还是公司),而且它还为我们提供了关于这些实体的额外信息。其中一条信息是实体类型——实体所属事物的类别。例如,AYLIEN是实体类型为的实体公司,乔布斯是一个实体,其实体类型为而且执行.让我们看看新闻API返回的JSON实体结果,即关于“Tim Cook为苹果工作”的故事中的句子:

"entities": [{"text": "Tim Cook", "score": 1, "类型”:““执行”、“人”、“代理”, "links": {"dbpedia": "http://dbpedia.org/resource/Tim_Cook"}}, {" text": "Apple", "score": 0.980344831943512, "类型”:““组织”、“公司”、“代理”, "links": {"dbpedia": "http://dbpedia.org/resource/Apple_Inc. "}})

你可以看到类型字段提供一些有用的信息:当搜索新闻时,这些信息允许我们搜索提到任何公司或任何高管的故事。因此,在我们的搜索中使用实体类型让我们可以进行非常广泛的搜索查询,通过添加一个参数检索更多相关的结果。

实体类型返回什么样的结果?

当我们利用实体类型参数时,我们可以检索与我们的用例更相关的结果。举个简单的例子,如果我们对与Facebook股价相关的新闻感兴趣,添加实体类型“指数(指的是股票指数)将结果范围缩小到引用任何股票指数的报道。看一看最近三篇英文报道的标题,它们的标题中包含“Facebook”,带有和不带有实体类型参数。

不使用“Index”作为实体类型参数:

“欧盟要求Facebook和Twitter定期更新俄罗斯虚假信息”“Facebook向某些公司提供优惠数据”“室内定位搜索和广告市场将在2025年实现巨大增长|谷歌,思科,Facebook - openPR”

当我们添加实体类型参数时,结果将缩小到提到任何股票交易所的消息。我们得到的结果主题仍然很宽泛,但都提到了Facebook股票的表现:

使用“Index”作为实体类型参数:

《从几个指标来看,Facebook似乎被低估了》《Truepoint Inc.收购Facebook股票》《Facebook市场:你应该知道的事》

将实体类型参数添加到News API查询非常简单—只需要在脚本中使用一行代码。只是添加”entities.body.type:“还有你感兴趣的类型列表。所以要像我们上面做的那样搜索股票指数,只需像这样添加参数:

“entities.body。类型:“(“指数”)

我可以在搜索中使用什么实体类型?

有数百种实体类型,您可以查看完整的列表在这一页上,但这里有一些流行的实体类型,你可以尝试与新闻API:

一般业务金融媒体OrganisationCompanyIndexMusicGenrePlaceProductFundMusicalArtistPersonCorporationCapitalNewspaperLocationSoftwareExchangeFilmPopulatedPlaceCorporationBankTelevisionShowValueDrugCurrencyMusicalWorkWebsiteInformationApplianceBankingBand

此外,我们最近更新了我们的实体和概念提取模型,使它们达到最先进的性能。这增加了News API能够识别的实体数量70%,使它能够识别范围更广的实体和概念,准确率更高。记住,要用News API测试实体类型,只需要获取API密钥,可以通过单击下面的图片开始免费试用。

开始免费试用

消息灵通

我们会不时通过电子邮件与您联系我们的产品和服务。