论坛搜索:社区论坛行业搜索最佳实践

简介:社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,这就要求搜索引擎对关键词和内容进行智能语义分析,通过机器识别出用户查询的真正意图,找到最全面最相关的结果进行需求满足。本文和大家详细介绍如何通过“开放搜索”在社区论坛场景的应用,带来更多的业务转化,以提升整体业务收入。

案例背景

某技术社区作为国内的中文IT内容社区,致力于为中国软件开发者提供知识传播、在线学习、职业发展等全生命周期服务,旗下包括多款产品。

自开始接触阿里云开放搜索产品,在一年的时间里逐步上量,陆续接入PC端、移动端的多个平台,覆盖首页搜索、博客、下载、问答等细分业务的频道搜索。通过开放搜索,为旗下产品的用户提供高质量的搜索服务,并通过搜索能力的优化带来更多的业务转化,以提升整体业务收入。

内容搜索场景需求:

»更多的曝光机会——空结果率低;
»更好的搜索质量——搜索相关性高;
»更丰富的业务特征——结合业务特性调整搜索结果;
»更全面的配套功能——智能纠错、下拉提示等配套能力;
»更低的拥有成本——相较自建搜索引擎更低的TCO成本;
»更便捷的开发使用——上线周期短,降低搜索引擎开发、效果调优难度;

以某论坛社区为例,产品线覆盖多个平台,包含网页、APP、小程序等形式,同时业务上区分多个频道。随着业务的发展,首页综合搜索(后简称“主搜”)的流量越来越大,各种付费、引流业务接入,对搜索流量的运营变得更加重要,对主搜的业务诉求越来越多,需要聚合多个频道的内容,同时搜索结果相关性要求更加精准,在考虑文本相关性的前提下,要加入更多的商业因素考虑,如eCPM等。
成熟的搜索引擎涉及离线模块、在线模块、查询理解服务、算法平台等系统组成,所需大量开发、算法调优以及持续的复杂运维工作,由于人力有限,社区论坛经过多方竞品调研和产品试用,最终接入阿里云开放搜索。

开放搜索最佳实践


更符合IT行业的查询理解功能
在核心索引上配置使用针对IT行业定制了词权重模型,纠错模型,改写模型等,扩大召回结果,精准命中需求;

排序优化
- 排序表达式应用
支持制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为基础排序(粗排),从命中的文档集合里海选出相关文档。第二轮为业务排序(精排),对粗排的结果做更精细筛选,支持任意复杂的表达式和特征函数应用,方便更准确控制排序效果,优化系统性能,提高搜索响应速度。定制CTR点击率预估模型,实现更智能的排序效果.

- 算法调优-人气模型
人气模型是淘宝搜索最基础的排序算法模型,计算量化出每个产品的静态质量及受欢迎的程度的值,将人气模型引入到排序表达式中,可构建更精细化的排序模型;

- 高级定制排序插件-Cava语言
更强的灵活性和定制能力:Cava提供了较表达式更加丰富的语法功能支持及时编译满足更多个性化的业务需求。

搜索引导功能

下拉提示
是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query

业务价值

对比客户基于开源自建的服务CTR提升超过80%
• 经迭代,开放搜索返回的搜索结果首位点击率高于某D站内搜索服务的点击率,期间多日点击率高出3%

配置前后效果对比


以上就是社区论坛行业开放搜索最佳实践的内容。

原文链接:https://developer.aliyun.com/article/780957?

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关推荐

相关文章