OpenAI最新模型——GPT-4o mini,已在微软Azure OpenAI同步上新!更快更便宜!
OpenAI推出的GPT-4o mini,以其高效成本和快速交付能力,助力用户打造卓越的应用程序。该产品在"大规模多任务语言理解"(MMLU)测试中,以82%的得分率显著超越了GPT-3.5 Turbo的70%,同时在成本上实现了超过60%的降低。GPT-4o mini不仅扩展了128K的上下文窗口,还融入了GPT-4o的多语言优势,为全球用户提供了更高质量的语言支持。
微软在Azure AI(国际版)上同步发布了GPT-4o mini,以卓越的速度支持文本处理功能,图像、音频和视频处理功能也将在近期推出。用户可以在Azure OpenAI Studio(国际版)Playground中免费体验这一服务。
------------------------------------------------------------------------------------------------
很多会员反馈想搭建自己的中转平台,如果你用户多可以考虑,如果大部分就自己在玩还是不建议折腾!原因一申请N次都不一定通过(折腾了几个月放弃时才通过),要使用还是得在官方申请靠谱,原因二微软件针对区域国家进行了配额限制,得选择美国、瑞典等区域建立多个渠道分发,总体来说还是折腾麻烦,当然自己也可一试验证该说法。看了下微软官方的文档实际上目前GPT-4o mini API还未开放,查看了所有区域也未发现该模型。
当然我们的全模型平台对接官方的gpt-4o-mini 模型已正常上线使用 https://api.cxhao.com
企业在国内如何合规、稳定使用ChatGPT?
出于合规角度,建议国内企业可以选择微软的Azure OpenAI服务来使用接口。
针对申请通过的企业用户出一篇部署教程,教程适用于部署所有模型供参考
----------------------------------------------------------------------------------------------
微软Azure版OpenAI GPT-4o部署指南
第一步:点击创建资源,如本站mj.cxhao.com采用3个API资源分发,分别选择美国东部、美国东部2、瑞典西部
第二步:如果上述图标没有可输入:OpenAI进行搜索
第三步:点击创建:Azure OpenAI
第四步:创建Open AI填入必要的信息:如区域为美国东部
下一步
下一步,可为空
到最后一步自动审阅通过点击创建
第五步:订阅
资源组(可以点击下面的按钮新建一个资源组,类似标记的tag)
区域:这个选择比较重要‼️,不同的区域有不同的模型。
比如:
Australia East 有GPT-4、GPT-3.5-Turbo模型,但是没有GPT-4o。East US 有GPT-4o、GPT-3.5-Turbo模型,但是没有GPT-4模型
第六步:完成资源组创建之后,进行模型部署创建。
在一个资源里面可以创建多个模型部署,每一个模型部署可以设置最大的并发请求数目。(这样就不用担心API访问频次受限啦,用多少可以进行配置)
进入后模型部署或者右下方选择进入都可以
第七步:选择部署模型的配置信息:
进入后点击增加部署基本模型
选择模型,界面是7月底刚升级过,如果是老界面稍有不同
出现对话模型后可选择模型版本或者默认即可,确定部署
显示GPT-4o具体部署的情况
再返回部署列表表示部署成功!
下面要怎么查看API接口呢?
微软提供API网址和密钥,只需要加在各gpt后台即可,返回组即可出现管理密钥选项
打开后查看调用的API网址及密钥
API接口具体使用方法
1、ChatGPT付费创作系统 https://www.ttbobo.com/6703.html 站点后台AI通道打开,增加KEY时输入网址和上面取到的密钥
AI名称可在后台对应修改为GPT-4o,输出效果感觉比以前使用openAI还快
TBWEB使用方法 https://www.ttbobo.com/6928.html,后台全局模型调用
后台模型设置里新增,填入代理网址及密钥即可
CWMP团队版使用方法 体验网址 https://cwmp.cxhao.com/ 下载网址https://www.ttbobo.com/6749.html
ChatGPT镜像版使用方法同上,其他系统或者二开自行补脑处理
配额和限制参考
以下部分提供适用于 Azure OpenAI 默认配额和限制的快速指南:
限制名称 | 限制值 |
每个 Azure 订阅中每个区域的 OpenAI 资源 | 30 |
默认 DALL-E 2 配额限制 | 2 个并发请求 |
默认 DALL-E 3 配额限制 | 2 个容量单位(每分钟 6 个请求) |
每个请求的最大提示令牌数 | 每个模型不同。 有关更多信息,请参阅 Azure OpenAI 服务模型 |
最大微调模型部署 | 5 |
每个资源的训练作业总数 | 100 |
每个资源同时运行的最大训练作业数 | 1 |
排队的最大训练作业数 | 20 |
每个资源的最大文件数 | 30 |
每个资源的所有文件的总大小 | 1 GB |
最大训练作业时间(如果超过,作业将失败) | 720 小时 |
最大训练作业大小(训练文件中的标记数)×(时期数) | 20 亿 |
每次上传的所有文件的最大大小(数据上的 Azure OpenAI) | 16 MB |
区域配额限值
模型的默认配额因模型和区域而异。 默认配额限制可能会更改。
型号 | 区域 | 每分钟令牌数 |
gpt-35-turbo | 美国东部、美国中南部、欧洲西部、法国中部、英国南部 | 240 K |
gpt-35-turbo | 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、瑞典中部、瑞士北部 | 300 K |
gpt-35-turbo-16k | 美国东部、美国中南部、欧洲西部、法国中部、英国南部 | 240 K |
gpt-35-turbo-16k | 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、瑞典中部、瑞士北部 | 300 K |
gpt-35-turbo-instruct | 美国东部、瑞典中部 | 240 K |
gpt-35-turbo (1106) | 澳大利亚东部、加拿大东部、法国中部、印度南部、瑞典中部、英国南部、美国西部 | 120 K |
gpt-4 | 美国东部、美国中南部、法国中部 | 20 K |
gpt-4 | 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞典中部、瑞士北部 | 40 K |
gpt-4-32k | 美国东部、美国中南部、法国中部 | 60 K |
gpt-4-32k | 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞典中部、瑞士北部 | 80 K |
gpt-4 (1106-preview) GPT-4 Turbo |
澳大利亚东部、加拿大东部、美国东部 2、法国中部、英国南部、美国西部 | 80 K |
gpt-4 (1106-preview) GPT-4 Turbo |
印度南部、挪威东部、瑞典中部 | 150 K |
gpt-4 (vision-preview) GPT-4 Turbo with Vision |
瑞典中部、瑞士北部、澳大利亚东部、美国西部 | 10 K |
text-embedding-ada-002 | 美国东部、美国中南部、欧洲西部、法国中部 | 240 K |
text-embedding-ada-002 | 美国中北部、澳大利亚东部、美国东部 2、加拿大东部、日本东部、英国南部、瑞士北部 | 350 K |
优化模型(babbage-002、davinci-002、gpt-35-turbo-0613) | 美国中北部、瑞典中部 | 50 K |
所有其他模型 | 美国东部、美国中南部、欧洲西部、法国中部 | 120 K |
保持在速率限制范围内的一般最佳做法
若要最大程度地减少与速率上限相关的问题,可以遵循以下方法:
- 在应用程序中实现重试逻辑
- 避免工作负载的急剧变化。 逐步增大工作负载。
- 测试不同负载增加模式。
- 增加分配给部署的配额。 如有必要,从另一个部署中移动配额。
如何请求增加默认配额和限制
可以通过 Azure AI Studio 的“配额”页面提交配额增加请求。 请注意,由于需求量巨大,配额提高请求正在接受中,将按接收顺序处理。 将优先考虑产生会消耗现有配额分配的流量的客户。如果不满足此条件,你的请求可能会被拒绝。
评论(0)