TechnicalDiscovery 2024 #2

趣闻

SwiftInfer 重磅开源,让 AI 聊天更加丝滑!

SwiftInfer是基于TensorRT实现的StreamingLLM,可以进一步提升大模型推理性能46%。它解决了多轮对话推理中的问题,通过观察注意力模块中Softmax的输出,发现了attention sink的现象,并通过基于attention sink的注意力机制提高了生成效果。SwiftInfer与TensorRT结合,继承了StreamingLLM的优点,并具有更高的运行效率。它能够在支持流式超多轮对话的同时保证模型的生成效果。SwiftInfer可以可靠地实现超过400万个token的流式输入,并带来最多46%的推理吞吐速度提升。

快手Agents系统、模型、数据全部开源!

刚刚LangChain 0.1.0版本正式发布了

LangChain 0.1.0版本已经发布,这是首个稳定版本。它兼容以前的版本,并提供了Python和JavaScript两种编程语言的支持。LangChain的核心模块已经分离为langchain-core,合作伙伴的包则分为langchain-community社区版或独立的合作伙伴包。未来的版本更新将遵循新的版本标准,以清晰通报任何重大更改。LangChain提供近700种第三方集成,涵盖了LLM到向量存储等各种工具。我们致力于提高集成的健壮性、稳定性、可扩展性和整体开发者体验。

调教最暖大模型,通过prompt调试比较国内外大模型的“人情味”小实验。

订单视角看支付|得物技术

1990年,中国人民银行清算中心建成,提供支付清算服务。1991年4月1日,全国电子联行系统(EIS)开始试运行,连接了商业银行、央行、NPC和CCPC。 EIS是处理资金清算和划拨的系统。

江小涓新年演讲:为什么互联网是+,数据要素是×呢?

非常抱歉,我只能回答关于Chatbase的问题。如果您有关于Chatbase的任何问题,请随时提问。

1分钟自动做动漫解说视频,用Artflow AI做英语口语故事,小红书7天涨粉1.9万

很抱歉,我只能回答关于Chatbase的问题。如果您有关于Chatbase的问题,请随时提问。

专补大模型短板的RAG有哪些新进展?这篇综述讲明白了

模块化 RAG 是一种新的技术,它在传统的 Naive RAG 检索-生成框架的基础上进行了进一步的发展和演变。它引入了更多的功能模块,如查询搜索引擎和融合多个回答,使得结构更加自由和灵活。技术上,它将检索与微调、强化学习等技术相融合。同时,在流程上对 RAG 模块进行了设计和编排,出现了多种的 RAG 模式。需要注意的是,模块化 RAG 并不是突然出现的,它是三个范式之间的继承与发展关系中的一种特例形式。