实体对象的更新

截至2021年7月,我们更新了新的实体对象的结构,并引入了实体的突出度和频率,以改善News API用户的体验,数据回填至2020年8月27日。使用实体频率或突出度搜索文章允许用户检索与他们感兴趣的实体相关的文章,而使用AQL查询文章促进了增强的实体相关查询。

如果您在此日期之前一直在您的工作流中使用实体(作为搜索参数或在您返回的故事对象中),您将需要更新您的工作流,以利用新的对象并避免工作流中的问题。本页面将介绍从使用旧实体对象转移到使用新实体对象需要做什么。

更新到实体对象

从旧实体对象的主要变化是:

  • 维基百科和Wikidata链接已经取代了DBPedia链接
  • 实体类型已经被改进和更新了吗
  • 情绪对每个实体都有预测吗
  • 股票行情已添加到实体对象中(如适用)
  • 实体现在被认为是在文章作为一个整体,并声明为在文章的标题和/或主体。
  • 实体突出这是一种衡量一个实体在一篇文章中的突出程度的方法。
  • 实体的频率即一个实体在一篇文章中被提及的次数,是针对每个实体计算的。

古老的实体对象:

{“标题”:{“指数”:[[0,6]],“链接”:{“dbpedia”:“http://dbpedia.org/resource/Google”},“文本”:“谷歌”、“类型”:(“组织”、“公司”)},“身体”:{“指数”:[[829、835]],“链接”:{“dbpedia”:“http://dbpedia.org/resource/Google”},“文本”:“谷歌”、“类型”:[“组织”,“公司”,]}}

新的实体对象

{“标题”:{“id”:“Q95”,“链接”:{“维基百科”:“https://en.wikipedia.org/wiki/Google”,“wikidata”:“https://www.wikidata.org/wiki/Q95”},“类型”:“组织”,“业务”,“人气”:{“极性”:“积极”,“信心”:0.52},“surface_forms”:[{“文本”:“谷歌”,“指数”:[[0,6]]}]},“身体”:{“id”:“Q95”,“链接”:{“维基百科”:“https://en.wikipedia.org/wiki/Google”,“wikidata”:“https://www.wikidata.org/wiki/Q80069”},“类型”:“组织”,“业务”,“人气”:{“极性”:“中性”,“信心”:0.77},“surface_forms”:[{“文本”:“谷歌”、“指数”:[[829、835]]}]}}

更新的实体对象:

{' id': 'Q95', 'links': {'wikipedia': 'https://en.wikipedia.org/wiki/Google', 'wikidata': 'https://www.wikidata.org/wiki/Q95'}, 'stock_tickers': ['GOOG'], 'types': ['Organization', 'Business'], 'overall_sentiment': {'polarity': 'neutral', 'confidence': 0.77}, ' overall_visibility ': 0.98, 'overall_frequency': 3, 'body': {' sentiment': {'polarity': 'neutral', 'confidence': 0.77}, 'surface_forms': [{' text': '谷歌','frequency': 2, 'mentions': [{'index': {'start': 829, 'end': 835}, 'sentiment':{“极性”:“中性”,“信心”:0.7656157}},{“指数”:{“开始”:1598年,“结束”:1604},“人气”:{“极性”:“中性”,“信心”:0.7704393 }} ] } ] }, ' 标题:{“人气”:{“极性”:“积极”,“信心”:0.52},“surface_forms”:[{“文本”:“谷歌”,“频率”:1、“提及”:[{“指数”:{“开始”:0,“结束”:6},“人气”:{“极性”:“积极”,“信心”:0.52143073 } } ] } ] } }

新建实体平面搜索参数

由于已经重新构造了实体对象,因此用户可以使用几个新的参数来查询News API。所有参数都可以使用'!”(例如,”!entities_id[]": ["Q2283"]返回不包括微软作为实体的故事)。

“entities_id”“Q2283”##返回在故事中提到微软的故事,该实体已被标记为其ID“entities_types”“组织”##返回故事中提到组织类型实体的故事“entities_stock_ticker”“微软”##返回在故事中提到微软的故事,该实体已被标记为股票行情“entities_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##返回在报道中提到微软的报道,该实体已被标记为相应的维基百科链接“entities_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##返回在故事中提到微软的故事,该实体已被标记为相应的Wikidata链接“entities_surface_forms_text”“微软”##返回在报道中提到微软的报道,该实体被标记为“Microsoft”的表面形式。
entities_id:“Q2283”##返回在故事中提到微软的故事,该实体已被标记为其IDentities_types:“组织”##返回故事中提到组织类型实体的故事entities_stock_ticker:“微软”##返回在故事中提到微软的故事,该实体已被标记为股票行情entities_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##返回在报道中提到微软的报道,该实体已被标记为相应的维基百科链接entities_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##返回在故事中提到微软的故事,该实体已被标记为相应的Wikidata链接entities_surface_forms_text:“微软”##返回在报道中提到微软的报道,该实体被标记为“Microsoft”的表面形式。
EntitiesId可选NewInterface([]字符串“Q2283”})//返回在故事中提到微软的故事,该实体已被标记为其IDEntitiesTypes可选NewInterface([]字符串“组织”})//返回故事中提到组织类型实体的故事EntitiesStockTicker可选NewInterface([]字符串“微软”})//返回故事中提到微软的故事,该实体已被标记为股票行情EntitiesLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//返回在故事中提到微软的故事,该实体已被标记为相应的Wikipedia链接EntitiesLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回在故事中提到微软的故事,该实体已被标记为相应的维基数据链接EntitiesSurfaceFormsText可选NewInterface([]字符串“微软”})//返回故事中提到微软的故事,该实体被标记为“Microsoft”的表面形式
entities_id= >Q2283//返回文章中提到微软的故事,该实体已被标记为其IDentities_types= >组织//返回故事中提到组织类型实体的故事entities_stock_ticker= >微软//返回文章中提到Microsoft的故事,其中该实体已被标记为股票行情entities_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回在故事中提到微软的故事,该实体已被标记为相应的Wikipedia链接entities_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回在故事中提到微软的故事,该实体已被标记为相应的维基数据链接entities_surface_forms_text= >微软//返回故事中提到微软的故事,该实体被标记为“Microsoft”的表面形式

已经从实体对象中删除了几个参数,不再可用于查询News API。用于排除值的参数也不再可用于查询。

“entities_title_id”“Q2283”##不再返回标题中提到微软的故事,该实体已被标记为其ID“entities_body_id”“Q2283”##不再返回在正文中提到微软的故事,而该实体已经在正文中标记了它的ID“entities_title_types”“组织”##不再返回标题中提到组织类型实体的故事“entities_body_types”“组织”##不再返回主体中提到组织类型实体的故事“entities_title_stock_ticker”“微软”##不再返回标题中提到微软的故事,该实体已被标记为股票行情“entities_body_stock_ticker”“微软”##不再返回在主体中提到微软的故事,该实体已被标记为股票行情“entities_title_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##不再返回标题中提到微软的故事,该实体已被标记为适当的维基百科链接“entities_body_links_wikipedia”“https://en.wikipedia.org/wiki/Microsoft”##不再返回在正文中提到微软的故事,该实体已被标记为适当的维基百科链接“entities_title_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##不再返回标题中提到微软的故事,该实体已被标记为适当的维基数据链接“entities_body_links_wikidata”“https://www.wikidata.org/wiki/Q2283”##不再返回在正文中提到微软的故事,该实体已被标记为适当的维基数据链接
entities_title_id:“Q2283”##不再返回标题中提到微软的故事,该实体已被标记为其IDentities_body_id:“Q2283”##不再返回在正文中提到微软的故事,而该实体已经在正文中标记了它的IDentities_title_types:“组织”##不再返回标题中提到组织类型实体的故事entities_body_types:“组织”##不再返回主体中提到组织类型实体的故事entities_title_stock_ticker:“微软”##不再返回标题中提到微软的故事,该实体已被标记为股票行情entities_body_stock_ticker:“微软”##不再返回在主体中提到微软的故事,该实体已被标记为股票行情entities_title_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##不再返回标题中提到微软的故事,该实体已被标记为适当的维基百科链接entities_body_links_wikipedia:“https://en.wikipedia.org/wiki/Microsoft”##不再返回在正文中提到微软的故事,该实体已被标记为适当的维基百科链接entities_title_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##不再返回标题中提到微软的故事,该实体已被标记为适当的维基数据链接entities_body_links_wikidata:“https://www.wikidata.org/wiki/Q2283”##不再返回在正文中提到微软的故事,该实体已被标记为适当的维基数据链接
EntitiesTitleId可选NewInterface([]字符串“Q2283”})//不再返回标题中提到微软的故事,该实体已被标记为其IDEntitiesBodyId可选NewInterface([]字符串“Q2283”})//不再返回在主体中提到Microsoft的故事,该实体已被标记为其IDEntitiesTitleTypes可选NewInterface([]字符串“Q2283”})//不再返回标题中提到组织类型实体的故事EntitiesBodyTypes可选NewInterface([]字符串“Q2283”})//不再返回在主体中提到组织类型实体的故事EntitiesTitleStockTicker可选NewInterface([]字符串“微软”})//不再返回标题中提到微软的故事,该实体已被标记为股票行情EntitiesBodyStockTicker可选NewInterface([]字符串“微软”})//不再返回在主体中提到Microsoft的故事,该实体已被标记为股票行情EntitiesTitleLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//不再返回标题中提到微软的故事,该实体已被标记为适当的维基百科链接EntitiesBodyLinksWikipedia可选NewInterface([]字符串“https://en.wikipedia.org/wiki/Microsoft”})//不再返回在正文中提到微软的故事,该实体已被标记为相应的Wikipedia链接EntitiesTitleLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回标题中提到微软的故事,该实体已被标记为相应的Wikidata链接EntitiesBodyLinksWikidata可选NewInterface([]字符串“https://www.wikidata.org/wiki/Q2283”})//返回在正文中提到微软的故事,该实体已被标记为相应的Wikidata链接
entities_title_id= >Q2283//返回标题中提到微软的故事,该实体已被标记为其IDentities_body_id= >Q2283//返回在正文中提到Microsoft的故事,在正文中该实体已被标记为其IDentities_title_types= >Q2283//不再返回标题中提到组织类型实体的故事entities_body_types= >Q2283//不再返回在主体中提到组织类型实体的故事entities_title_stock_ticker= >微软//返回标题中提到微软的故事,该实体已被标记为股票行情entities_body_stock_ticker= >微软//返回在主体中提到Microsoft的故事,该实体已被标记为股票行情entities_title_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回标题中提到微软的故事,该实体已被标记为相应的Wikipedia链接entities_body_links_wikipedia= >https://en.wikipedia.org/wiki/Microsoft//返回在正文中提到微软的故事,该实体已被标记为相应的Wikipedia链接entities_title_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回标题中提到微软的故事,该实体已被标记为相应的Wikidata链接entities_body_links_wikidata= >https://www.wikidata.org/wiki/Q2283//返回在正文中提到微软的故事,该实体已被标记为相应的Wikidata链接

更新您的DBpedia搜索,以使用Wikipedia和Wikidata代替。

新的实体对象包含Wikipedia链接,而不是DBpedia链接。要更新您的工作流,使其通过Wikipedia和Wikidata链接而不是DBpedia链接进行搜索,您需要更新参数名称和正在搜索的链接。

旧的参数和值:

“entities.title.links。dbpedia[]”(“http://dbpedia.org/resource/Donald_Trump”):“entities.body.links。dbpedia[]”(“http://dbpedia.org/resource/Donald_Trump”):

新的参数和值:

“entities.links。维基百科[]”(“https://en.wikipedia.org/wiki/Donald_Trump”):“entities.links。wikidata[]”(“https://www.wikidata.org/wiki/Q22686”):

请注意,尽管大多数DBpedia url将通过简单的替换精确地映射到Wikipedia的urlhttp://dbpedia.org/resource/https://en.wikipedia.org/wiki/,有些则不会。我们建议您使用DBpedia链接和Wikipedia链接来测试当前搜索的实体。如果您注意到某个实体返回的结果中有任何差异,您应该检查Wikipedia以查找该实体的正确url。

更新正在搜索的实体类型

新的实体模型将更精细的类型数据应用到它所识别的实体上。尽管概念上类似,但新实体对象中的类型略有不同。这是因为Wikidata现在是底层而不是DBpedia的杠杆。

检索包含Apple作为组织(而不是水果)的文章,只需调用Stories端点并在AQL查询参数中提供类型参数,如下例所示:

“https://api.www.daredevilro.net/news/stories?aql=entities%3A%7B%7Bsurface_forms.text%3AApple +和+类型% 3 aorganization % 7 d % 7 d”

您还可以在新的实体对象上测试以下常见类型,或者查看完整列表在这里

组织 位置 业务 人类
国家 货币 产品 职业
技术 公司 银行 软件
Financial_institution Stock_exchange U.S._state

实体突出度和频率

实体突出度是衡量一个实体在文章中的突出程度。显著性得分的范围在0到1之间,它衡量的是该实体被提到的位置离文章顶部有多近,该实体是否在文章标题中被提到,以及该实体在整篇文章中被提到的次数。下面的示例查询返回包含实体谷歌的项目,突出度评分在0.7到1之间。下面的示例查询返回包含实体谷歌的项目,突出度评分在0.7到1之间。

{"aql": "entities: {{surface_forms:Microsoft AND overall_salient:[0.7 TO *]}}"}

实体频率就是一个实体在文章标题、正文或整个文章中被提及的次数。可以通过两种方式查询频率,一种是使用overall_frequency参数筛选具有总体(标题+正文)频率值的文章,另一种是使用Frequency参数和element参数筛选具有在文章标题或正文中具有频率值的实体的文章。下面的示例检索文章,包括文章中至少两次提到的表面形式为“Trump”的实体,标题和正文结合在一起。

{"aql": "entities: {{surface_forms: Trump AND overall_frequency:[2 TO *]}}"}

实体级人气

情感现在是在实体层面预测的,对于从故事主体、标题和整个故事中提取出来的每个实体。每个实体对象包含极性而且信心对象:

"sentiment":{"极性":"正面","信心":0.78}"

测试增强的搜索功能

随着这些新数据被添加到实体对象中,我们还添加了新的搜索功能,以便在它们的搜索中适当地利用这些数据。具体来说,我们现在允许用户搜索提到满足多个标准的实体的内容。看一看在这里了解如何进行这些查询。