据外媒报道,微软的Bing搜索引擎日前宣布对该平台进行新的基于AI的改进带来,尤其是图像搜索部分。据悉,这些改进支持多粒度匹配同时还改进了对用户查询、图像和网页以及它们之间的关系的理解。
现在,微软整合了BERT/Transformer技术--有点像谷歌--1. 利用预先训练号的知识来更好地解释文本信息;2. 图像与网页嵌入的注意机制使嵌入的文档能够很好地概括图像的突出区域和网页上的关键点。
Microsoft还从查询和候选文档中提取一组精选对象属性并使用这些属性进行匹配。
如上图,这允许Microsoft微软能够将查询{老人游泳图片}跟图像内容及其周围文本中的类似属性进行匹配。现在可以认为查询和文档是精确匹配的,因为它们共享相同的属性。这对于更精确的搜索非常有用,用户可以搜索具有多种特定特征的条目,例如{带胡子的金发男人}、{带玫瑰的女孩舞蹈服装})。
另外,微软还会自动生成文档元数据包括图像,然后更容易跟搜索匹配。最有用的元数据类型之一被称作最具代表性查询,简称BRQ。通常情况下,BRQ指的是对网页主要主题和主要图像内容的很好总结。而为Bing图像生成BRQ的过程非常依赖于许多现代的深度学习技术。
微软表示,这些技术已经对他们的搜索引擎的实用性和准确性产生了真正的影响。另外它还表示,Bing图像搜索现在提供了对用户查询更深层次的语义理解。
网友评论(共有 0 条评论)