A. 如何让百度快速收录
1、使用多个词语搜索:
输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。
例如:想了解上海人民公园的相关信息,在搜索框中输入 [上海 人民公园] 获得的搜索效果会比输入 [人民公园] 得到的结果更好。
2、网络快照:
如果无法打开某个搜索结果,或者打开速度特别慢,该怎么办?“悔滚网络快照”能帮您解决问题。每个被收录的网页,在网络上都存有一个纯文本的备份,称为“网络快照”。网络速度较快,您可以通过“快照”快速浏览页面内容。 不过,网络只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。如果您无法连接原网页,那么快照上的图片等非文本内容,会无法显示。
下面是搜索“金庸”的一个结果摘要,请点击右下角的“网络快照”链接,感受一下网络快照带来的便利!
其他的搜索引擎也有类似的功能,非常有帮助。
3、选择适当的查询词:
搜索技巧,最基本同时也是最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循:
表述准确 网络会严格按照您提交的查询词去搜索,因此,查询词表述准确是获得良好搜索结果的必要前提。
一类常见的表述不准确情况是,脑袋里想着一回事,搜索框里输入的是另一回事。
例如,要查找2004年国内十大新闻,查询词可以是“2004年国内十大新闻”;但如果把查询词换成“2004年国内十大事件”,搜索结果就没有能满足需求的了。
4、另一类典型的表述不准确,是查询词中包含错别字。
例如,要查找林心如的写真图片,用“林心如写真”,当然是没什么问题;但如果写错了字,变成“林心茹写真”,搜索结果质量就差得远了。
不过好在,网络对于用户常见的错别字输入,有纠错提示。您若输入“林心茹写真”,在搜索结果上方,会提示“您要找的是不是: 林心如写真”。
查询词的主题关联与简练 目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,您最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题正唯关联的查询词。
还是用实际例子说明。某三年级小学生,想查一些关于时间的名人名言,他的查询词是“小学三年级关于时间的名人名言”。
这个查询词很完整的体现了搜索者的搜索意图,但效果并不好。
绝大多数名人名言,并不规定是针对几年级的,因此,“小学三年级举前培”事实上和主题无关,会使得搜索引擎丢掉大量不含“小学三年级”,但非常有价值的信息;“关于”也是一个与名人名言本身没有关系的词,多一个这样的词,又会减少很多有价值信息;“时间的名人名言”,其中的“的”也不是一个必要的词,会对搜索结果产生干扰;“名人名言”,名言通常就是名人留下来的,在名言前加上名人,是一种不必要的重复。
因此,最好的查询词,应该是“时间名言”。
5、试着找出下述查询词的问题,并想出更好的能满足搜索需求的查询词:
所得税会计处理问题探讨
周星驰个人档案和所拍的电影
根据网页特征选择查询词 很多类型的网页都有某种相似的特征。例如,小说网页,通常都有一个目录页,小说名称一般出现在网页标题中,而页面上通常有“目录”两个字,点击页面上的链接,就进入具体的章节页,章节页的标题是小说章节名称;软件下载页,通常软件名称在网页标题中,网页正文有下载链接,并且会出现“下载”这个词。等等。
经常的搜索,并且总结各类网页的特征现象,并应用查询词的选择中,就会使得搜索变得准确而高效。
例如,找明星的个人资料页。一般来说,明星资料页的标题,通常是明星的名字,而在页面上,会有“姓名”、“身高”等词语出现。比如找林青霞的个人资料,就可以用“林青霞 姓名 身高”来查询。而由于明星的名字一般在网页标题中出现,因此,更精确的查询方式,可以是“姓名 身高 intitle:林青霞”。Intitle,表示后接的词限制在网页标题范围内。
这类主题词加上特征词的查询构造方法,适用于搜索具有某种共性的网页。前提是,您必须了解这种共性(或者通过试验性搜索预先发现共性)。
6、找软件下载:
日常工作和娱乐需要用到大量的软件,很多软件属于共享或者自由性质,可以在网上免费下载到。
直接找下载页面 这是最直接的方式。软件名称,加上“下载”这个特征词,通常可以很快找到下载点。
例:flashget 下载
在着名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。
小提示:一旦搜索范围局限在专业下载站中,“下载”这个特征词就不必在查询词中出现了。
7、找问题解决办法:
我们在工作和生活中,会遇到各种各样的疑难问题,比如电脑中毒了,被开水烫伤了等等。很多问题其实都可以在网上找到解决办法。因为某类问题发生的几率是稳定的,而网络用户有好几千万,于是几千万人中遇到同样问题的人就会很多,其中一部分人会把问题贴在网络上求助,而另一部分人,可能就会把问题解决办法发布在网络上。有了搜索引擎,我们就可以把这些信息找出来。
找这类信息,核心问题是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。
例如,我们上网时经常会遇到陷阱,浏览器默认主页被修改并锁定。这样一个问题的解决办法,我们应该怎样搜索呢?首先要确定的是,不要用自然语言。比如,有的人可能会这样搜索“我的浏览器主页被修改了,谁能帮帮我呀”。这是典型的自然语言,但网上和这样的话完全匹配的网页,几乎就是不存在的。因此这样的搜索常常得不到想要的结果。我们来看这个问题中的核心词汇。对象:浏览器(或者IE)的主页。事件:被修改(锁定)。“浏览器”、“主页”和“被修改”,在这类信息中出现的概率会最大,IE可能会出现,至于锁定,用词比较专业化,不见得能出现。于是关键词中,至少应该出现“浏览器”、“主页”和“被修改”,这是问题现象描述。
一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。
8、找产品使用教程:
我们装了一个新软件,或者家里买了新的产品(如数码相机),往往会需要一个细致的教程。类似的教程在书店里常可以买到,但在网上一样也可以搜索到。教程的搜索,有两个要点,第一个要点是,这个教程是针对什么产品做的。这点比较好确定。比如说,我们想找office2000的教程,这第一个要点就是“office2000”了。第二个要点是,这类教程,通常会有一些什么样的特征关键词。也就是说,如果某个网页是某类产品的教程,这个页面上,会有一些什么样的词汇,来表明这个网页是个教程。
对这些特征关键词的把握是搜索老手和新手的差别所在。其实只要平时做个有心人,对类似问题多总结,多记忆,搜索技能就会慢慢熟练。对教程类网页而言,常出现的特征关键词有:教程、指南、使用指南、使用手册、从入门到精通等等,而在URL链接中,通常会有汉语拼音的“jiqiao”来标注这个页面是技巧帮助性页面。通过一次搜索就达到目的通常会有些困难,但多次试验,总会构建出一个非常好的搜索关键词。
B. 关于网站内容如何快速被百度搜索收录的经验和技巧
首先,需要保持每天都文章更新,5-7篇原创最好,如果没有这么多可以用高度伪原创,内容以企业新闻孙源雀,行业动态,行业新闻等为主
文章的关键词以5%最高,文章字数以300-800字为宜,关键词可做内链,链接到站内相应的板块
其次,外裂含链部分,虽然现在支持做外链的平台在减少,但依然可以找到相应行业的平台,每天做一则早点就好
重点是能够坚持每天更新,让搜索引擎形成抓取的习惯,这样你的网站就可以有权重了
还有一点,增加收录量,你可以去申请一个网络站长工具账号,绑定你的网站并验证,天天提交你新发布的文章链接,网络的熊掌号也可以考虑做
C. 如何快速提升自然搜索流量
老花一直在强调,想提升哪个入口的流量,我们首先就要了解该流量是如何产生的,然后逆向思考,如何去做提升。
自然搜索流量的产生:是因为用户在淘宝搜索框搜索某关键词。
而你的宝贝标题中,正好含有该关键词。
并且该关键词的权重较高,所以搜索排名较高,排在靠前的位置。
然后,用户被你的主图所吸引,产生点击,进入你的宝贝页面(店铺),这就产生了自然搜索流量。
了解了自然搜索流量的产生,我们就知道从哪几个方面来提升自己的流量。
首先就是标题的设计:
标题只有三十个字,我们要使其尽可能多的包含买家会搜索的关键词,这样你的宝贝被搜索到的可能性才更大。
那我们就要考虑,买家想找到这款宝贝的时候,会搜索一些什么词,该词搜索量大不大,以此为凭借,来进行选词旁模顷,制作标题。
老花就不多_嗦,有需要的可以看看老花的专栏文章,有介绍最简单的选词方法与组合技巧。
接着,标题设计好了,买家搜索某关键词时,淘宝能检索到你的宝贝了,可是搜索排名(展现位置)也不一定会靠前,因为你的关键词权重不够,只能靠后排。
当然,影响搜索排名的因素不仅仅是关键词权重,是由多方面因素构成,(老花这里也无法细说,铺开来,键盘可能都要磨坏!)但是关键词权重可以说是最直接的影响因素。
那我们就必须先积累一定的关键词权重,才能运陆在搜索页面的前几页,甚至第一页就看到我们的宝贝,让宝贝有足够的曝光/展现。
影响关键词权重的因素:该关键词的人气、转化已及确认收货(好评),就是用户搜索该关键词,并看到点击你的宝贝,到促成码罩订单,确认收货(好评),的整个过程,就会为该关键词积累不错的人气。
当积累到一定的人气之后,再搜索该关键词,你就能在前几页找到你的宝贝了。
最后,看到了你的宝贝还不够,如果没有形成点击,那么也不会有流量产生。
影响点击的一个最重要的决定性因素就是产品的主图,这因该不用多说。
那么如何制作一张高点击率的主图,也是我们需要仔细考虑的。
篇幅有限,介绍到这里,如果哪位朋友对本文,还有哪里不明白,欢迎评论或私信咨询我,我会第一时间帮助你传道解惑。
D. 电脑如何快速查找文件
问题一:如何快速查找电脑中的文件 怎么搜索电脑里的文件,方法一
如果你记得文件名 直接用win+F调出windows搜索管理器
例如:我们要找一首歌曲 像风一样自由
直接在想要搜索的文件和文件名输入
像风一样自由,搜索范围不确定可以选全盘,立即搜索。
方法二:如果你忘了文件名,但是知道文件的类型,
例如:我们要找一首mp3
我们就可以这样搜索输入:*.mp3
这样我们就可以找到硬盘上所有的mp3类型的文件了。
方法三:我们还可以用组合的方法来搜索电脑里的文件
可以用*和?来组合来查找文件
例如,我们知道这个文件名字中有“风”的mp3,我们可尺亮以输入*风*.mp3来搜索。
步骤阅读
5
网上还有一些硬盘搜索工具,原理也和这些方法类似,有些工具先对硬盘进行了检索,在搜索内容的时候速度稍快一点。
无论哪种查找电脑里的文件的方法,只要能记住文件类型(doc、txt、jpg、gif),如果文件名能记住那就用方法一,很快就能找到电脑里的文件。
问题二:电脑里的文件不知道在哪位置,如何快速查找 文件名还记得不?用电脑自带的搜索功能就能找到。记不到名字就安文件类型搜索吧?
问题三:在使用电脑时怎么才能在众多文件中快速找到我想要的文件 很多人电脑越用越久了,文件、软件慢慢的也越来越多。如果我们直接要一个个文件找过来找到我们所需要的文件个人感觉是非常难的。这时候我们就要秒用我们电脑的搜搜功能。
1、xp系统一般通过右键我的电脑,然后点击搜搜进行查找文件。
2、win7系统大粗困败部分人比较相关用开始菜单里面的搜搜功能。
在搜搜里面输入我们想要的文件名字,很多时候都会有一堆文件,我们不知道那个才是我们想要的。这时候我们可以点击文档,打开资源管理器窗口,单击文件夹窗口右上角的更改您的视图按钮,从下拉菜单中选择内容视图。这时候看起来就清洗很多了,比较方便找到我们想要的。
3、有些搜搜词的搜搜是我们很经常要用到的。如我由于工作需要经常要修改hosts文件,但是这个文件是系统文件我不好移动位置。所以我只能把搜搜记录保存下来。下次要使用的时候快很多。
使用方法:在搜搜结果里面右键,在弹出的窗口中点击保存搜搜。这时候这个搜搜就会被保存为虚拟文件夹。以后我们再次搜搜这个内容,相当于打开这个文件夹。速度快了很多。
问题四:如何快速搜索电脑里的文件和文件夹 1.打开‘我的电脑’点击‘搜索’
2.在点击后,我的电脑的左边会出现相关的搜索内容,在相应的查找框中输入*.txt,点击‘立即搜索’
3.稍微等一下,在我的电脑的右边将会列出所有的文本文档搜索结果,在页面中就能快速找到所需要的文件了
4.在搜索结果中打开需要的内容,就能快速找到和定位需要的文档了。
问题五:电脑里文件夹太多,怎么快速找到自己想要找的文件夹? 1.打开计算机。
2.C抚rl+F
3.在搜索框输入需要搜索的文件或者文件夹回车即可
问题六:在电脑怎么快速查找文件存放路径 ? 直接把那串地址复制粘贴到我的电脑里的地址那行~回车就行~!
问题七:怎样可以快速找到电脑硬盘里的文件夹? 有啊!!开始-搜索-文件或文件夹-所有文件或文件夹
问题八:如何快速找到电脑中的文件 只要知道叮件名,打开“我的电脑”,点击“搜索”按钮,会出现一个搜索对话框,在对话框中输入文件名,再点击下方的“搜索”按钮,电脑就会自动帮你找到你要找的文件。岩颤
问题九:电脑文件查找快捷键? 同时按下键盘上的WIN和F键就可以调出“搜索”栏
问题十:如何查找电脑中快捷方式文件 5分 在图标上单击右键,在弹出的菜单中选择属性,在快捷方式选项中看目标位置,就能知道文件的位置了。
然后你就可以按照文件的位置,打开我的电脑,一直找到文件所在的文件夹。有一个更方便的方法,就是在属性的快捷方式选项中,有一个“打开文件位置”的按钮,直接点击它,就能打开文件所在的文件夹。
E. 掌握10个常用搜索技巧,让你快人一步
你在网络搜索框里如何搜,会不会这样问网络:“我急需要知道喜马拉雅山为什么不是8848的数据,你能不能在下午五点之前告诉我?”搜索是和机器对话,不是和人讲话。你需要输入的是关键词,而不是礼貌的求助问话!所以搜索的基本功就是把你的问题变成关键词,让搜索更高效。下面十条搜索技巧,让你的搜索开车技能从只会挂一档提升到可以换二档。
001 选对了关键词,让机器人更懂你
当我们搜索时,首先,搜索引擎算法会在索引中查询我们的搜索关键词以找到适当的网页。这些算法会 分析相关关灶族键字在某个网页上(不论是在标题中还是在正文中)的出现频率和显示位置 。
一般你有明确的搜索需求,就直接把需求作为关键词就ok,但我们也会经常遇到脑海中记不清或认不得的事物时,没有养成筛选特征信息并整合的习惯,还有就是以图搜图不得结果,就忙不迭地跑到群里或者网络发帖求助,正确的做法是养成良好的 特征提取,关键词整合 的习惯来自行解决问题的能力的必要性。对于记忆模糊的事物,我们可以通过零碎的记忆信息来找寻事物;对于想找的图片用以图搜图未果,可以通过描述图片特征的关键词来搜索。
002. 学点逻辑表达式,让你搜索更省力
and表示数学里面‘与’的逻辑关系。搜索“关键词A and 关键词B”,则返回同时包含前后两个关键词的结果。
AND 和 OR [北京 上海 平均工资] [北京 OR 上海 平均工资]
3 双引号让你搜索更精准
查询词加上双引号“”则表示查询词不能被拆分,在搜索结果中必需完整出现,可以对查询词精确匹配。如果不加双引号“”经过网络分析后可能会拆分。查询词加上书名号《》有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内毕谨容,不会被拆分隐数弊。 书名号在某些情况下特别有效果,比如查询词为手机,如果不加书名号在很多情况下出来的是通讯工具手机,而加上书名号后,《手机》结果就都是关于电影方面的了。
4. 搜索不仅可以做加法,还可以做减法
查询词用减号-语法可以帮您在搜索结果中排除包含特定的关键词所有网页。例子:电影 -qvod。查询词“电影”在搜索结果中,“qvod”被排除在搜索结果中。
例如:搜索“注册会计师考试”,你一定会发现一堆讨厌的广告!!试试这么做:搜索“注册会计师考试 -推广 -推广链接”,对比一下就会发现,多年前的互联网体验,又回来了!这样其实是从结果中去除“推广”和“推广链接”字样,就可以获得相对的自然的搜索结果了。
5 “+”包含特定查询词
查询词用加号+语法可以帮您在搜索结果中必需包含特定的关键词所有网页。例子:电影 +qvod。查询词“电影”在搜索结果中,“qvod”被必需被包含在搜索结果中。
6. 规避网络全家桶,记得带上site
您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。例如:网络影音 site:。“site:”后面跟的站点域名,不要带“http://”。site:和站点名之间,不要带空格。
7 特殊文件搜索,filetype更好用
查询词用Filetype语法可以限定查询词出现在指定的文档中,支持文档格式有pdf,doc,xls,ppt,rtf,all(所有上面的文档格式)。对于找文档资料相当有帮助。例子:photoshop实用技巧 filetype:doc
8 在标题中搜索 intitle
网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。例如:出国留学 intitle:美国。intitle:和后面的关键词之间不要有空格。
9 巧用竖线,查得更全
搜索 小蜘蛛不仅会聚焦,也会帮我们放大范围,竖线就会让我们查得更全
关键词A|关键词B’命令返回的结果是包含关键词A或者关键词B的网页。
和or命令的区别是,‘|’命令相当于分别搜索两个关键词,然后把结果整合在一起,按照相关性进行排列。
10.在网址中搜索inurl
网页url中的某些信息,常常有某种有价值的含义。您如果对搜索结果的url做某种限定,可以获得良好的效果。例如:auto视频教程 inurl:video。查询词“auto视频教程”是可以出现在网页的任何位置,而“video”则必须出现在网页url中。
F. 电商搜索如何让你买得又快又好“整流程”(五)
其它相关文章整理: https://zhuanlan.hu.com/p/51015148
本文介绍用户感知较弱的召回和排序模块,主要以技术方案和实现为主进行介绍(主要为下图中,搜索服务的一些工作)。这一过程和推荐非常类似,区别主要为召回源更多地考虑了当前搜索词,排序特征也加入搜索词特征及其影响到的交叉特征,排序依据建立在相关性基础上。
往简单来讲,用户输入了搜索词,系统通过搜索词找到与搜索词相关的商品集合,系统通过用户及商品的情况进行排序,最终展现给用户。
0.找不到
但是在构建搜索系统的初期总是无法精准地帮助用户找到想要的商品主要原因有以下几点:
不同的用户对同一种诉求的表达往往是有差别的,往往会存在一种比较常见的现象,用户输入的query并不能清晰准确的表达需求。这一块是可以通过较好的产品设计及实时反馈来做精确需求表达捕捉,产品设计主要是前面介绍的引导类产品(下拉推荐、筛选、锦囊等),实时反馈是指快速捕捉用户在当前query下的正负反馈,系统捕捉其中的query意图。
搜索系统对用户query的理解能力较弱,无法挖掘出用户的真实需求。这仔差一块则更多是算法发力的点,通过文本、行为、session等数据挖掘query本身的内涵,这一块更多是QU(query understanding)的工作。
用户输入了长尾词,过多条件无法匹配到商品。这一块也可以通过QU和QR(query rewrite)来逐步解决。
召回结果集的排序不合理,可能用户需求的内容被排在后面而未曝光。这一块则是排序的问题了,建立一个良性的评分排序公式,并且利用算法合理建模用户决策过程。
从流程上来说,如下图
接下来我们分别通过讲解QP、召回、排序来对上述流程解构。首先来看以下QP里面的各个模块。
1.QP模块
1.1 QU/query understanding
1.1.1 概述
1.1.1.1 目的
拆解用户搜索词的意图
比如新品,年龄,尺码,属性,类目等搜索意图识别及归一
1.1.1.2 任务
Query词性及主体结构,主要词/描述词等: 2018最新款适合胖胖的女生穿的连衣裙
预测用户搜索商品类目(category)性别(gender): 手提电脑、t恤 女
属性&标签识别: 品牌,颜色,尺寸: 裙子红色,43码nike球鞋
搜&逛:强意图/转化&弱意图/逛: 连衣裙 & Iphone XR 256G
1.1.1.3 方法
方颤缺法词表穷举法,规则解析法,机器学习方法
1.1.1.4 意图识别的难点
输入不规范,不同的用户对同一诉求的表达存在差异。
多意图,“苹果” 可以是产品词,也可以是品牌词;可以是手机,也可以是水果。
数据冷启动。当用户行为数据较少时,很难获取准确的意图。
1.1.2 词性&主体识别&属性/标签识别
词性的识别有助于整个搜索系统快速地找到和定位相关商品,也可以帮助快速定位核心词、属性词等。
搜索过程中,不同term对于检索有不同的意义,不能本末倒置。不同重要程度的词,应该在召回茄戚辩排序阶段给予相应不同的影响,核心词具有更高的分值。当用户搜”children toys“召回商品时,核心词是toys,children为修饰词,根据term weight来进行排序降权的。细粒度地还可以做进一步区分产品词、品牌词、型号词、停用词。query被完整匹配和部分匹配的权重是不同的、单词命中和多词命中同一商品也需要考虑权重情况。
其它还包括了中心词逻辑、热词逻辑、纠错系统、丢弃词逻辑、词性标注等工作。常见方法词性识别有,基于规则和基于统计的词性标注(HMM)。
1.1.3 词画像
词属性
基础属性:pv、uv、gmv、ctr、cvr等
业务属性:品牌词、大促属性
词质量分
词关系
同义词、形近词、同音词、子母品牌、类目、文本相似性
词维度的用户画像
1.1.4 强弱意图
用户强弱意图/转化意图识别,可以快速帮助搜索系统定位召回及排序策略,不同的意图可以带来不同的排序和展现效果。如强意图下相关性因子应该加强,弱意图下应该更加注重点击/转化等反馈行为量。
强意图/转化型: 需要快速帮助用户定位所需的商品 (因素:价格、品牌、品质、商家等),推送引导的目的是让用户作出购买,收藏等决策,追求转化的数量+速度+质量。
弱意图/闲逛型: 需要帮助用户发掘新的兴趣、新的话题,但同时不能让用户 感觉无聊,目的是满足用户需求,把用户喜欢的推荐给他,追求 pv/点击率。
根据用户行为和query的静态信息,分析query是搜索型(偏向买)还是浏览型(偏向逛)。后续利用模型对query分类,用以分析排序策略对不同类型query的影响,方便对不同类型query作不同排序。
分析用户个性化标签的浏览行,转化型趋势。
若干特征举例:
session+query内商品的点击率
Session内不同query的个数
空格数量
相关一级类目个数
停留时长再逛和搜query中表现差异大
行业分布:服装鞋包/3c、美容护理、食品保健、话费充值差异大
1.1.5 类目预测
Query的类目预测主要是,分析Query和哪些类目的意图更相关(当然这里用户维度的信息也会被考虑进来)。query通过搜索引擎召回后,一般将类目相关性作为重要的海选排序因子,保留一部分商品,一方面保证了效率,另一方面也从源头保证类目的相关性,保证用户体验。从实际工作来看,fasttext是一个非常不错,实践也较快的算法。
类目举例
常见模型
1.2 QR/query rewrite
1.2.1 概述
1.2.1.1 问题
query和商品描述之间存在gap,特别是中长尾query。多种描述,信息冗余,属性检索,宽泛意图。
1.2.1.2 目标
文本和意图,通过对原始Query进行改写,生成一系列相关Query,把相关Query作为原始Query的补充,与原始Query一起参与搜索,从而得到更加丰富和准确的匹配结果
1.2.1.3 方法
query embedding和multi-method
1.2.2 query embedding
query embedding(query映射到query),可以针对“多种描述”和信息冗余问题意图改写:query映射到意图,主要针对属性检索和宽泛意图类型;也可以进行相似query挖掘。
向量改写流程: query向量化->向量相似查找->相关性判断;借鉴skip-throught-vector,使用seq2seq重建句子周围的句子,假设某个session序列是(s1,s2,…,sn),那么一条训练数据为(si-1,si,si+1),encoder是si的词序列的lstm,decoder是分别si-1和si+1,这样训练下来decoder的上下文向量就学到了这个句子在session中的上下文表示。
1.2.3 multi-method
通过语义、行为、session log等挖掘出相似的query。
多维度相似融合再排序: 按照点击相似度、文本相似度、Session相似度衡量Query之间的相似度,得到候选的Pair(可选)交给重排序模块,对Query pair的优先级做优化,生成Top K的改写结果。
基于行为Item cf/swing、Simrank++
基于session Word2vec、seq2seq
基于内容 Word2vec
融合 LR/GBDT
2.召回&检索模块: ltm/learn to match
2.1 检索依据
电商商品: 图片+标题+属性+交互,检索项包括但不限于:商品名称,商品标题、副标题,商品描述,商品参数、规格,商品品牌,商品品类,别名关联商品,促销类型
相关性(query&tittle/content,行为,session): 融合点击相似度、文本相似度、Session相似度衡量Query之间的相似度,除了前面介绍的通过query session来做query embedding,用query来重建其点击过的宝贝标题/描述序列同样适用,只不过decoder阶段换成query点击过的标题。
2.2 语义搜索
语义搜索是指不单单考虑词维度的精确匹配,而是语义层面来做。增加搜索结果的相关性,提升用户体验外,也可以一定程度上遏制商家商品标题堆砌热门关键词的问题。
2.2.1 常见doc&query匹配方法
BM25通常计算query和Doc文本term的匹配程度。由于query和doc之间的语义gap,可能存在很多语义相关,但文本并不匹配的情况。
通过商品内容理解和语义标签: 通过商品图片,详情页,评价和同义词,上下位词等给商品打标签和扩充商品索引内容
语义匹配: Dssm模型将query和文本变成向量,用向量内积表达语义相似度
匹配深度与高度: 词->短语->语义->主题->句法
词->短语->语义->主题->句法
embedding-similar
2.3 无结果优化
二次/三次召回:放弃权重低term,扩大检索字段和检索范围
Query 纠错 & 同义词改写:同时用原词和同义词去检索,最后对两者返回的结果取并集。
分类意图识别的优化,首先根据 Query 分布定义了 8 类意图:可以通过识别 Query 中 Term 的意图来判定整个 Query 的意图
3.ltr/learn to rank
精排系统主要服务于个性化排序,召回粗排由搜索引擎负责完成,精排侧重更细粒度特征,更复杂模型,实时性。精排所需特征,模型基本复用搜索引擎的技术,可以支持高密度的数据存储和高并发读取。
3.1 评分体系: 静态分 * 动态分
静态分体现商品的转化,商品品质,背后供应商品质
动态分体现商品与query的相关性,个性化分,用二元分类(Binary Classification)来优化点击/购买概率。
3.1.1 评分系统-静态分
• 稳定性,连续性,区分度
3.1.2 评分系统-动态分
预测出每一条商品在给定以上条件组合(q,u,o)下发生交易行为的概率。
p(q,i,u)预估
gmv最大化模型-洪亮颉老师
相关特征-洪亮颉老师
3.2 其它加权因子主要分为几个维度:
相关度、商业化因素、个性化因素、人为因素、数据模型统计。
4.总结
搜索技术服务模块必然与产品设计迭代并行,并且通过数据分析来支持整个流程优化,抓住重点和系统最大短板进行迭代。
下一篇文章以搜索相关的数据分析为导向,介绍搜索产品与功能需要关注的一些指标,以及对整个平台的作用。
G. OPPO A55如何快速搜索照片
需要快速寻找一张照片,但是一个一个往上滑喊森模动查找太慢了?那就快来试试OPPO A55快速搜索照片这个好用的功能吧!
1、点击手机相册在相册顶部有一个搜索栏
2、点击搜索栏——可以搜索时间、地点、人郑缓物来快速找到这张照片
3、搜索2020年2月点进去就可以看到2020年2月的照片了
4、搜索地点比如成都点进去就可以看到你在成都的所有照片了
5、还可以通过人名来搜索人物照片但是需要提前设置好人物的名称哈