近日,华为低调推出最新旗舰手机mate60 pro,在中国社会乃至世界都引起了高度关注和热议。
不过,除了讨论有关“麒麟芯片”、“5G”、“卫星通话”等产品、技术、科研乃至中美关系等问题外,还发生了一件令人哭笑不得的事情:华为推出最新型手机,却让香港明星刘德华火了,并贡献了一个互联网新梗——“刘德华为手机”。
本期【知微见著】就从科技角度和您聊聊网络热梗背后的技术话题——“无脑”的关键词检索。
这个爆火的话题源自网友们发现很多带有“刘德华”的提问,回答里都是风马牛不相及的“无脑黑”华为手机的内容。
一旦出现将“刘德华”与“为什么”两个词组放在一起作为标题的提问,其中“(刘德)华为(什么)”会立即触发识别到“华为”这个关键词,被输入过相关指令的水军机器人账号,就会自动在提问下面评论抹黑华为手机的文案。
图源网络
这还不是个例,社交媒体平台上许多和华为毫无任何关联的新闻资讯,甚至是用户个人发的生活动态,都会招致一群不太聪明的AI水军。
刘德华和华为终于被“黑”在一起了!9月25号,华为秋季全场景新品发布会重磅召开,发布了全新超高端品牌“ULTIMATE DESIGN非凡大师”,并宣布刘德华担任品牌大使。
“刘德华代言华为手机”登顶热搜,不少网友直呼惊喜,甚至开始玩梗 “刘德华为在,不怕没柴烧”,更引发了一波对抹黑华为背后金主的群嘲:花钱雇的水军机器人不够智能,不仅平时总是“误伤”,现在反而免费为华为品牌营销助力热度。
可见,人类语言对话交流复杂多变,只知道匹配关键词、执行触发规则的机器人是无法进行精准的语义及情感理解。
关键词匹配算法是指根据需要匹配的关键词和已有的关键词进行比较,以确定它们之间的相似程度和匹配度,从而得到所需结果的算法。
传统关键词检索方法,难以同时在准确率、识别速度和实时性等方面取得良好效果。
准确的语义理解十分重要。联著基于自主知识产权的语义工程技术,开发出联著语义解析器TSP,可以从文本中提取出关键词匹配法完全提取不到的语义信息,实现文本语义高保真识别。
解决“词不达意”的问题。当关键词与主语义不匹配时,往往导致误判。在获取关键词的基础上,利用主语义分析,进一步对整句、甚至整段的主语义进行分析判断,能有效减少“词不达意”的情况。
解决“有意无词”的问题。TSP解析器能够从连续字符串中抽取各类语义元,比如文本中有表示住址的描述“家在……”或“在……住”等的句子,但是没有“住址”这个关键词,语义解析器可以将所有这样类似的表达式的语义元名都抽象为“住址”,再以“住址”去做条件匹配。
解决“无法枚举”的问题。文本中包含的很多概念是无限集合,例如“人名”,无法用一组有限的关键词表示所有具体的概念。如果用关键词表示,无论用多少,总有遗漏。采用基于语义元层次网络的算法,可以大大减少此类问题。
解决“语义搭配”的问题。有些时候,语法、词法都正确的句子,语义也可能出问题。例如,“南京市长江大桥结婚了”,用业内常用的分词工具大概率会切分成“南京市/长江大桥/结婚了”。这个结果从语法上看没毛病,分词也都正确,只有语义上说不通。面对这种情况,通过关键词匹配无法发现问题。联著TSP解析器专门设计了“语义搭配”的语义分析,可以有效解决这类问题。经过语义分析,该句应该切分成“南京/市长/江大桥/结婚了”。
人类语言对话交流有丰富的内涵和千变万化的情绪,在沟通方式上,不论是文字还是语音,都和语义紧密结合。只有打通感官与认知,由表及里地理解用户要传达的意思,才能为用户提供高质量的服务。
“语义理解,是人工智能技术的皇冠。”基于自主知识产权的语义工程技术,联著针对不同垂直领域,提供包括文本内容数据化、语义搜索引擎化、内容性质判断、主题素材汇编四大核心服务能力的“零样本文本智能综合解决方案”。
目前,联著各类产品已广泛应用于档案、金融、水利、传媒、医疗等众多领域,为20000余家客户提供智能化服务。