实体对象的更新

截至2021年7月,我们已经更新了新实体对象的结构,并引入了实体突出度和频率,以改善News API用户的体验,数据回补至2020年8月27日。使用实体频率或显著性搜索条目允许用户检索与其感兴趣的实体相关的条目,而使用AQL查询条目则有助于增强与实体相关的查询。

如果您在此日期之前一直在您的工作流中使用实体(作为搜索参数或在您返回的故事对象中),您将需要更新您的工作流,以利用新的对象,并避免您的工作流的问题。本页面将介绍从使用旧实体对象到使用新实体对象所需要做的事情。

更新实体对象

旧实体对象的主要变化是:

  • 维基百科和Wikidata链接已经取代了DBPedia链接
  • 实体类型已经改进和更新
  • 情绪现在每个实体都能预测了吗
  • 股票行情已添加到实体对象中(适用时)
  • 实体现在被认为是作为一个整体出现在文章中,并被声明在文章标题和/或正文中。
  • 实体突出,衡量一个实体在一篇文章中的重要性,现在对每个实体进行计算。
  • 实体的频率,计算一个实体在一篇文章中提到的次数。

古老的实体对象:

{“标题”:{“指数”:[[0,6]],“链接”:{“dbpedia”:“http://dbpedia.org/resource/Google”},“文本”:“谷歌”、“类型”:(“组织”、“公司”)},“身体”:{“指数”:[[829、835]],“链接”:{“dbpedia”:“http://dbpedia.org/resource/Google”},“文本”:“谷歌”、“类型”:[“组织”,“公司”,]}}

新的实体对象

{“标题”:{“id”:“Q95”,“链接”:{“维基百科”:“https://en.wikipedia.org/wiki/Google”,“wikidata”:“https://www.wikidata.org/wiki/Q95”},“类型”:“组织”,“业务”,“人气”:{“极性”:“积极”,“信心”:0.52},“surface_forms”:[{“文本”:“谷歌”,“指数”:[[0,6]]}]},“身体”:{“id”:“Q95”,“链接”:{“维基百科”:“https://en.wikipedia.org/wiki/Google”,“wikidata”:“https://www.wikidata.org/wiki/Q80069”},“类型”:“组织”,“业务”,“人气”:{“极性”:“中性”,“信心”:0.77},“surface_forms”:[{“文本”:“谷歌”、“指数”:[[829、835]]}]}}

更新的实体对象:

{' id': 'Q95', 'links': {'wikipedia': 'https://en.wikipedia.org/wiki/Google', 'wikidata': 'https://www.wikidata.org/wiki/Q95'}, 'stock_tickers': ['GOOG'], 'types': ['Organization', 'Business'], 'overall_sentiment':{'极性':'中性','信心':0.77},'overall_frequency': 0.98, 'body':{'情绪':{'极性':'中性','信心':0.77},'surface_forms':[{'文本':'谷歌','频率':2,'提到':[{'索引':{'开始':829,'结束':835},'情绪'::{“极性”:“中性”,“信心”:0.7656157}},{“指数”:{“开始”:1598年,“结束”:1604},“人气”:{“极性”:“中性”,“信心”:0.7704393 }} ] } ] }, ' 标题:{“人气”:{“极性”:“积极”,“信心”:0.52},“surface_forms”:[{“文本”:“谷歌”,“频率”:1、“提及”:[{“指数”:{“开始”:0,“结束”:6},“人气”:{“极性”:“积极”,“信心”:0.52143073 } } ] } ] } }

新实体平面搜索参数

由于实体对象已经重新构造,用户可以使用几个新参数来查询News API。所有参数都可以使用'!”(例如,”!entities_id[]": ["Q2283"]返回不包括Microsoft作为实体的故事)。

“entities_id”“Q2283”##返回在故事中提到微软的故事,其中的实体已经用它的ID标记“entities_types”“组织”##返回在故事中提到组织类型实体的故事“entities_stock_ticker”“微软”##返回在故事中提到Microsoft的故事,其中的实体已经被标记为股票行情“entities_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##返回在故事中提到微软的故事,在这个故事中,该实体已经被其适当的维基百科链接标记“entities_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##返回在故事中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接“entities_surface_forms_text”“微软”##返回在故事中提到微软的故事,其中实体已经被标记为表面形式“Microsoft”
entities_id:“Q2283”##返回在故事中提到微软的故事,其中的实体已经用它的ID标记entities_types:“组织”##返回在故事中提到组织类型实体的故事entities_stock_ticker:“微软”##返回在故事中提到Microsoft的故事,其中的实体已经被标记为股票行情entities_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##返回在故事中提到微软的故事,在这个故事中,该实体已经被其适当的维基百科链接标记entities_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##返回在故事中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接entities_surface_forms_text:“微软”##返回在故事中提到微软的故事,其中实体已经被标记为表面形式“Microsoft”
EntitiesId可选NewInterface([]字符串“Q2283”})//返回在故事中提到微软的故事,其中的实体已经被标记为它的IDEntitiesTypes可选NewInterface([]字符串“组织”})//返回在故事中提到组织类型实体的故事EntitiesStockTicker可选NewInterface([]字符串“微软”})//返回在故事中提到Microsoft的故事,其中的实体已经被标记为股票行情EntitiesLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//返回在故事中提到微软的故事,在这个故事中,该实体被标记为相应的Wikipedia链接EntitiesLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回在故事中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接EntitiesSurfaceFormsText可选NewInterface([]字符串“微软”})//返回在故事中提到Microsoft的故事,该实体被标记为“Microsoft”
entities_id= >Q2283//返回在文章中提到微软的故事,其中该实体已被标记为其IDentities_types= >组织//返回在故事中提到组织类型实体的故事entities_stock_ticker= >微软//返回在文章中提到Microsoft的故事,其中该实体已被标记为股票行情entities_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回在故事中提到微软的故事,在这个故事中,该实体被标记为相应的Wikipedia链接entities_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回在故事中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接entities_surface_forms_text= >微软//返回在故事中提到Microsoft的故事,该实体被标记为“Microsoft”

一些参数已从实体对象中删除,不再用于查询News API。用于排除值的参数也不再用于查询。

“entities_title_id”“Q2283”##不再返回在标题中提到微软的故事,在那里该实体已经被标记为其ID“entities_body_id”“Q2283”##不再返回在正文中提到Microsoft的故事,在正文中该实体已经被标记为其ID“entities_title_types”“组织”##不再返回标题中提到组织类型实体的故事“entities_body_types”“组织”##不再返回在正文中提到组织类型实体的故事“entities_title_stock_ticker”“微软”##不再返回标题中提到Microsoft的故事,其中实体已被标记为股票行情“entities_body_stock_ticker”“微软”##不再返回在主体中提到Microsoft的故事,在主体中该实体已经被标记为股票行情“entities_title_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##不再返回在标题中提到微软的故事,在标题中该实体已被其相应的维基百科链接标记“entities_body_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##不再返回在正文中提到微软的故事,在正文中,该实体已被其相应的Wikipedia链接标记“entities_title_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##不再返回标题中提到微软的故事,在标题中该实体已被标记为相应的Wikidata链接“entities_body_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##不再返回在正文中提到Microsoft的故事,在正文中,该实体已被标记为相应的Wikidata链接
entities_title_id:“Q2283”##不再返回在标题中提到微软的故事,在那里该实体已经被标记为其IDentities_body_id:“Q2283”##不再返回在正文中提到Microsoft的故事,在正文中该实体已经被标记为其IDentities_title_types:“组织”##不再返回标题中提到组织类型实体的故事entities_body_types:“组织”##不再返回在正文中提到组织类型实体的故事entities_title_stock_ticker:“微软”##不再返回标题中提到Microsoft的故事,其中实体已被标记为股票行情entities_body_stock_ticker:“微软”##不再返回在主体中提到Microsoft的故事,在主体中该实体已经被标记为股票行情entities_title_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##不再返回在标题中提到微软的故事,在标题中该实体已被其相应的维基百科链接标记entities_body_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##不再返回在正文中提到微软的故事,在正文中,该实体已被其相应的Wikipedia链接标记entities_title_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##不再返回标题中提到微软的故事,在标题中该实体已被标记为相应的Wikidata链接entities_body_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##不再返回在正文中提到Microsoft的故事,在正文中,该实体已被标记为相应的Wikidata链接
EntitiesTitleId可选NewInterface([]字符串“Q2283”})//不再返回在标题中提到微软的故事,其中的实体已被标记为其IDEntitiesBodyId可选NewInterface([]字符串“Q2283”})//不再返回在正文中提到Microsoft的故事,在正文中该实体已经被标记为其IDEntitiesTitleTypes可选NewInterface([]字符串“Q2283”})//不再返回标题中提到组织类型实体的故事EntitiesBodyTypes可选NewInterface([]字符串“Q2283”})//不再返回在正文中提到组织类型实体的故事EntitiesTitleStockTicker可选NewInterface([]字符串“微软”})//不再返回在标题中提到Microsoft的故事,其中的实体已被标记为其股票行情EntitiesBodyStockTicker可选NewInterface([]字符串“微软”})//不再返回在body中提到Microsoft的故事,在body中该实体已经被标记为股票行情EntitiesTitleLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//不再返回在标题中提到微软的故事,在那里该实体已被标记为其适当的Wikipedia链接EntitiesBodyLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//不再返回在正文中提到Microsoft的故事,在正文中该实体已经被相应的Wikipedia链接标记EntitiesTitleLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回标题中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接EntitiesBodyLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回在正文中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接
entities_title_id= >Q2283//返回在标题中提到微软的故事,其中的实体已经被标记为其IDentities_body_id= >Q2283//返回在正文中提到Microsoft的故事,其中的实体已经被标记为其IDentities_title_types= >Q2283//不再返回标题中提到组织类型实体的故事entities_body_types= >Q2283//不再返回在正文中提到组织类型实体的故事entities_title_stock_ticker= >微软//返回标题中提到Microsoft的故事,其中的实体已经被标记为股票行情entities_body_stock_ticker= >微软//返回在正文中提到Microsoft的故事,该实体已经被标记为股票行情entities_title_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回标题中提到微软的故事,该实体已被相应的维基百科链接标记entities_body_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回在正文中提到Microsoft的故事,该实体已经被相应的Wikipedia链接标记entities_title_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回标题中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接entities_body_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回在正文中提到Microsoft的故事,其中该实体已被标记为相应的Wikidata链接

更新DBpedia搜索,改为使用Wikipedia和Wikidata。

新的实体对象包含Wikipedia链接而不是DBpedia链接。要将工作流更新为通过Wikipedia和Wikidata链接而不是DBpedia链接进行搜索,需要同时更新参数名称和正在搜索的链接。

旧的参数和值:

“entities.title.links。dbpedia[]”(“http://dbpedia.org/resource/Donald_Trump”):“entities.body.links。dbpedia[]”(“http://dbpedia.org/resource/Donald_Trump”):

新的参数和值:

“entities.links。维基百科[]”(“https://en.wikipedia.org/wiki/Donald_Trump”):“entities.links。wikidata[]”(“https://www.wikidata.org/wiki/Q22686”):

请注意,尽管大多数DBpedia url将通过简单替换准确地映射到Wikipedia urlhttp://dbpedia.org/resource/https://en.wikipedia.org/wiki/,有些则不会。我们建议您使用DBpedia链接和Wikipedia链接来测试当前正在搜索的实体。如果您注意到某个实体返回的结果有任何差异,您应该在维基百科上查找该实体的正确url。

更新正在搜索的实体类型

新的实体模型对它所识别的实体应用更精细的类型数据。尽管概念上相似,但新实体对象中的类型略有不同。这是因为现在在底层使用Wikidata而不是DBpedia。

检索包含Apple作为组织(而不是水果)的文章,只需调用Stories端点,并在AQL查询参数中提供类型参数,如下面的示例所示:

“https://api.www.daredevilro.net/news/stories?aql=entities%3A%7B%7Bsurface_forms.text%3AApple +和+类型% 3 aorganization % 7 d % 7 d”

您还可以在新的实体对象上测试以下常见类型,或查看完整列表在这里

组织 位置 业务 人类
国家 货币 产品 职业
技术 公司 银行 软件
Financial_institution Stock_exchange U.S._state

实体突出度和频率

实体突出度是衡量一个实体在文章中的突出程度。突出度分数的范围在0到1之间,是一个衡量该实体在文章顶部被提及的距离,该实体是否在文章标题中被提及,以及该实体在整个文章中被提及的次数的指标。下面的示例查询返回包含实体谷歌的文章,突出度评分在0.7到1之间。下面的示例查询返回包含实体谷歌的文章,突出度评分在0.7到1之间。

{"aql": "实体:{{surface_forms:Microsoft AND overall_凸显:[0.7 TO *]}}"}

实体频率是指一个实体在文章标题、正文或整篇文章中被提及的次数。可以通过两种方式查询频率,一种是使用overall_frequency参数来过滤具有整体(标题+正文)频率值的实体的文章,另一种是使用Frequency参数和元素参数来过滤具有在文章标题或正文中具有频率值的实体的文章。下面的示例检索的文章包括文章中至少两次提到的表面形式为“Trump”的实体,标题和正文结合在一起。

{"aql": "实体:{{surface_forms: Trump AND overall_frequency:[2 TO *]}}"}

实体级人气

情感现在可以在实体层面进行预测,即从故事主体、标题和整个故事中提取的每个实体。每个实体对象包含极性而且信心对象:

“情绪”:{“极性”:“积极”,“信心”:0.78}"

测试增强的搜索功能

在将这些新数据添加到实体对象之后,我们添加了新的搜索功能,以便在搜索中适当地利用这些数据。具体来说,我们现在允许用户搜索涉及满足多种条件的实体的内容。看一看在这里如何进行这些查询。