论文笔记:Scaling Sentence Embeddings with Large Language Models

news/2025/2/25 16:46:14

2024 ACL findings

1 intro

  • 直接利用LLMs生成句子嵌入面临两个主要挑战
    • LLMs作为自回归模型生成的是文本而非向量,因此需要将输出向量化
    • 如何有效地将上下文学习的能力融入句子嵌入中也是一个关键问题
  • 论文调查了当前LLMs在句子嵌入中的能力
    • 如何使用LLMs表示句子嵌入,并且提示工程是否有效?
      • 设计了一套prompt
    • 上下文学习是否能提升句子嵌入的质量?
      • ——>通过添加定义句子和相应的词作为示例进行上下文学习,性能可以进一步提高
    • 当模型参数超过数十亿时,参数规模是否依然有效?
      • 从数百万个参数到数十亿个参数的过渡,能够提高STS任务的表现。
      • 然而,继续扩大参数规模可能不会带来更多的改善。
        • 即使是上下文学习,66B的OPT在STS任务上仍然不如6.7B的OPT
      • 尽管如此,扩大模型规模能提高迁移任务的性能。
        • 具有数十亿参数的LLMs在没有任何微调的情况下,仍展现出强大的性能,甚至达到了最新的状态。
    • 将当前对比学习框架融入LLMs后能取得哪些改进?
      • 通过采用对比学习可以进一步提高性能。
      • 通过采用高效的微调技术,LLMs即使在有限计算资源下,也能够在STS任务上取得最先进的成果
  • 通过评估LLaMA和OPT在语义文本相似度(STS)任务和迁移任务上的表现,进行系统性研究

2 方法

2.1 使用LLMs表示句子

  • 提取最后一个token的隐藏向量作为句子嵌入
    • 把bert风格的prompt(“This sentence: “ [text] ” means [MASK]”)改成OPT风格的(This sentence: “ [text] ” means in one word: “)

2.2 使用高效微调的对比学习

  • 还利用对比学习来提升LLMs的句子嵌入能力,已被证明是一种高效的学习方法
    • 这里使用了有监督对比学习
      • 每个句子x_i都有对应的正面句子x_i^+和硬负面句子x_i^-
      • l是sequence length

3 实验


http://www.niftyadmin.cn/n/5865721.html

相关文章

基于嵌入式linux的数据库:SQLite

数据库基本概念 1. 数据(Data) 能够输入计算机并能被计算机程序识别和处理的信息集合。 2. 数据库 (Database) 数据库是在数据库管理系统管理和控制之下,存放在存储介质上的数据集合。注:数据库管…

GO 进行编译时插桩,实现零码注入

Go 编译时插桩 Go 语言的编译时插桩是一种在编译阶段自动注入监控代码的技术,目的是在不修改业务代码的情况下,实现对应用程序的监控和追踪。 基本原理 Go 编译时插桩的核心思想是通过在编译过程中对源代码进行分析和修改,将监控代码注入到…

网络安全-系统层攻击流程及防御措施

系统层攻击流程涉及多个阶段,攻击者通过逐步渗透以获取控制权或窃取数据。以下是详细的流程及防御措施: 1. 侦察(Reconnaissance) 信息收集: 主动扫描:使用工具如Nmap、Masscan扫描目标IP、开放端口、服务…

深度学习训练平台建设中的性能优化实践

在当今数据驱动的时代,深度学习已成为人工智能领域的关键技术。然而,深度学习的成功不仅依赖于算法的先进性,还极大地依赖于训练平台的性能和效率。本文将探讨深度学习训练平台建设中的性能优化实践,特别是在任务模板、数据处理、…

pycharm技巧--鼠标滚轮放大或缩小 Pycharm 字体大小

1、鼠标滚轮调整字体 设置 Ctrl 鼠标滚轮调整字体大小 备注: 第一个是活动窗口,即缩放当前窗口 第二个是所有编辑器窗口,即缩放所有窗口的字体 2、插件 汉化包: Chinese Simplified 包

[SWPUCTF 2022 新生赛]ez_rce

打开题目就在线环境,发现只有一句话:真的什么都没有吗 F12查看控制台和源代码也没发现任何信息,然后用虚拟机里面的dirsearch扫一下这个网站就能得到: 然后这里扫出来的结果查看的直接就是robots.txt,然后就能看到: …

面试题 - Vue 3 如何优化性能?

面试题 - Vue 3 如何优化性能? 最近,总有小伙伴来问我,在面试时应该如何回答关于优化方面的问题。其实,我们在日常的项目开发中,或多或少都接触过一些优化技巧,只是有时候自己没有特别留意,或者…

AI写代码工具ScriptEcho:赋能数据分析,驱动精准营销

在数字化时代,数据已成为企业发展的核心资产。而前端开发作为连接用户和数据的桥梁,其效率直接影响着数据分析的质量和营销决策的精准性。传统前端开发在处理海量用户行为数据时,常常面临效率低下、代码维护困难等挑战。然而,随着…