OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本 红桃九小编 • (2024-10-02 10:25) OpenAI开发者大会推出四大创新:提示词缓存可减少50%输入token成本
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍 红桃九小编 • (2024-10-01 16:45) AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍