据CNBC报道,凡是在亚马逊上找过产品评论的人都知道,其他购物者的经验有多宝贵,也知道自己多容易陷入用户评论的“无底洞”——从五星好评到一星差评,有时要读上几百字才能抓住重点。
而如今,亚马逊正在持续推出其声称能“让购物更轻松”的AI功能,由AI生成的产品音频描述便是其中之一。该功能会抓取用户评论内容,最终或许会取代用户评论,成为购物决策时的首选信息来源。
这款名为“Hear the Highlights”(聆听亮点)的AI语音产品描述功能,依托大型语言模型生成摘要脚本。它会从亚马逊产品目录、用户评论及全网信息等多种渠道抓取内容,再将这些内容转化为简短的音频片段。
该摘要功能于今年夏季开始推出,最初仅针对部分美国用户开放,且仅覆盖特定产品;如今已面向所有美国用户开放,在移动端购物应用中以按钮形式呈现,同时覆盖范围扩大至超过100万件产品。
亚马逊及其他电商平台的独特吸引力,一直在于人们能从真实用户而非仅从产品描述中获取信息。当然,尽管亚马逊禁止付费推广及其他不实评论形式,但虚假评论(bogus reviews)长期以来一直是其面临的难题。
你仍需甄别各类钻系统空子(various efforts to game the system)的行为,近年来还出现了新迹象——最新的评论撰写者竟是ChatGPT这类聊天机器人(the newest review writers are chatbots like ChatGPT)。
但真实用户分享的、与产品相关的真实且独特的体验——即用户作为信息来源,助力理性决策——一直是人们了解产品的关键环节:无论是了解服装鞋码、产品安全性,还是解答更具体的问题,比如买新烤面包机时,它能烤贝果吗?定时设置准不准?清理面包屑托盘容不容易?
AI能否在这一点上做得更好?从本质上来说,评论因个体意见庞杂而显得繁杂难用,但事实证明,人类读者非常擅长从混乱的人类评论信息中提炼出自己需要的内容(but human readers have proven pretty adept at distilling what they need from the human chaos)。
从某种意义上说,亚马逊产品评论的普通读者的大脑就是一个相当出色的大型语言模型,能快速浏览并筛选出关键词和关键信息——因此,AI若想如承诺的那样为消费者体验加分,其信息提炼能力至少得和人类一样出色。
AI与认知过载
AI确实有其优势。首先,当面对亚马逊上一款拥有超过3.2万条评论的电热水壶时,它不会出现认知过载的情况。它能梳理这些数据,但能否只提供我们需要或想了解的信息呢?这一点AI仍难以准确做到,而且将产品详情、用户评论和网络信息整合为一份提炼内容,本质上可能存在问题——因为这些信息来源各自带有不同的目的。
“重要的是要认识到人工智能目前在哪些领域表现出色,例如在自动化和模式识别方面,以及在哪些领域仍存在不足,比如需要高度判断力的任务。”Murf AI(一家专注于AI配音的公司)的CEO兼联合创始人安库尔·埃德基表示,“一个关键问题在于,在生成这些摘要时,是否有办法将用户背景作为输入因素纳入考量。”
埃德基表示,AI的价值在于找到“问题与能力的恰当匹配(proper problem-capability fit)”。若无法实现这一点,AI 的 噱头感便可能趁虚而入,进而引发AI疲劳——他认为消费者如今很可能已感受到这种疲劳。
目前,亚马逊“Hear the Highlights”的AI音频摘要对所有用户都是完全相同的(Amazon’s Hear the Highlights AI-audio summaries are currently the same for every user)。
埃德基表示:“AI生成的摘要需要捕捉到细微差别与上下文信息。例如,即便只有少数关于安全性的负面评论,也可能盖过许多关于其他功能的正面评价。”他补充道,若消费者仅关注产品性能,那么强调价格的摘要可能就不相关了。
纳入上下文因素、并让评论过程更像是消费者与机器之间的对话,这很可能是该技术的发展方向——换句话说,是朝着AI的智能代理属性方向发展。亚马逊也在积极丰富其AI电商工具库,例如工具Rufus,以及一款名为Interests AI的购物工具。该工具会提示用户“用自己的话”描述一个兴趣点,随后生成一份精选产品列表。这一功能于今年春季推出,独立于亚马逊网站的主搜索栏。
埃德基表示,聊天和音频摘要仍将是与用户互动的方式之一,而与AI语音代理进行实时对话——提出具体问题、澄清疑虑、从评论中获取更深入的见解——才能将这种体验从单向信息传递转变为双向探索,从而使其更具个性化。
他表示:“目前,你可以通过文本或语音输入与Rufus互动,但Rufus无法回复语音,其回应均为纯文本形式。”他补充道:“然而,通过借助语音代理,你可以与能开口说话的机器人进行双向对话。”
目前,有一类购物者可能会立即从中受益,那就是视障购物者——这使得“可及性”成为该功能一个值得关注的特点,但前提是语音质量必须过硬,且能准确传递内容。
消费者研究公司Feedback Group的负责人布莱恩·努曼维尔表示,通过为视觉呈现的信息提供一种基于音频的替代方式,这类功能有潜力提升购物的可及性(these types of features have the potential to make shopping more accessible),将详尽的文本转化为易于获取的音频摘要。
然而,要让该功能真正惠及视障人群,就必须对其进行精心设计。努曼维尔表示,这需要做到几点:确保(该功能)与屏幕阅读器和键盘导航完全兼容、提供清晰、有条理且简洁的摘要、避免出现过长或晦涩的音频内容。此外,AI生成语音的质量和清晰度也将对该功能的可用性产生重大影响。
努曼维尔表示:“从多样化的人类评论转向AI生成的摘要,可能意味着会丢失重要的细微差别、上下文信息以及个人特色(The shift from diverse human reviews to AI-generated summaries might mean losing important nuances, context, and personal touches)。”
丢失购物者独特见解的风险
AI倾向于关注共同主题,即便在提炼信息时,也可能会淡化回应的信息量(The tendency of AI to focus on common themes can dilute responses even as it distills them)。
人类评论往往包含偏离主题的故事,以及围绕非常具体使用场景的细节——想想促使人们写下评论的初衷是什么,再想想这些内容如何与购物者的顾虑及决策过程高度契合——而所有这些都能让购物体验更具个性化,也更有参考价值。
努曼维尔表示:“对于那些与大多数反馈不相符的独特见解或小众需求,AI可能会忽略。此外,人们对评论进行批判性解读的能力——比如识别某些偏见、信任特定评论者——在AI生成的摘要中会有所减弱。”
通过抓取大量内容生成摘要,同时也牺牲了能够区分产品描述、用户评论和网络信息的标注(Scraping a great deal of content to generate the summaries also sacrifices the annotation that can distinguish among product descriptions, customer reviews, and web information)。
努曼维尔表示:“目前尚不完全明确,在当前的应用版本中,产品描述和用户评论分别被采用了多大比例——亚马逊尚未详细说明这种比例构成。”
努曼维尔表示:“产品描述通常以营销为导向,侧重突出优势;而评论则反映真实用户体验,既包含优点也提及缺点。”若将两者不加来源标注地混在一起——本质上会模糊信息来源的差异性——消费者可能难以区分广告话术与真实评论,最终结果可能类似原生广告。
努曼维尔补充道:“若这种混合情况真的发生,可能会无意间误导消费者——要么给主观观点赋予事实可信度,要么将宣传内容伪装成客观评论。”
研究确实表明,消费者倾向于信任语音这种信息传递形式,无论所传递的信息是否均衡(Research does show that customers are inclined to trust voice as a format of information delivery, regardless of how balanced the information being delivered is)。
“在我看来,亚马逊推销产品的意愿,很可能比纳入对产品的所有批判性观点更为重要。”澳大利亚科廷大学(Curtin University)互联网研究教授塔玛·利弗表示。
利弗补充道:“另一个担忧是,AI可能会侧重平均评分和总体评分,而买家往往会关注为数不多的负面评论——也就是一星评论——即便这类评论数量并不多。”
Zoom通讯公司的研究科学家诺曼·达瓦拉塔巴德博士表示,在他个人看来,这项技术正朝着提升客户体验的方向发展。“我认为这项技术能帮助我们做出明智的决策。”他说道,并指出通读客户评论可能会带来认知疲劳和时间浪费。