diff --git a/OllamaStudy.UseExtensionsAI/OpenAIAPITest.cs b/OllamaStudy.UseExtensionsAI/OpenAIAPITest.cs index 811ae5e..5bf4b7a 100644 --- a/OllamaStudy.UseExtensionsAI/OpenAIAPITest.cs +++ b/OllamaStudy.UseExtensionsAI/OpenAIAPITest.cs @@ -20,6 +20,7 @@ namespace OllamaStudy.UseExtensionsAI private readonly HttpClient _uiUiAPIHttpClient; private readonly HttpClient _bailianHttpClient; private readonly HttpClient _zipuHttpClient; + private readonly HttpClient _siliconflowHttpClient; public OpenAIAPITest ( @@ -38,37 +39,51 @@ namespace OllamaStudy.UseExtensionsAI _uiUiAPIHttpClient = _httpClientFactory.CreateClient("UiUiAPIHttpClient"); _bailianHttpClient = _httpClientFactory.CreateClient("BailianHttpClient"); _zipuHttpClient = _httpClientFactory.CreateClient("ZiPuHttpClient"); + _siliconflowHttpClient = _httpClientFactory.CreateClient("SiliconflowHttpClient"); } - #region 各种业务Client + #region 获取各种 HttpClient /// /// 从OpenAIClient获取各种业务 Client /// [Fact] - public void GetClients_Test() + public void Get_Clients_Test() { Assert.NotNull(_defaultHttpClient); Assert.NotNull(_ollamaHttpClient); Assert.NotNull(_uiUiAPIHttpClient); Assert.NotNull(_bailianHttpClient); Assert.NotNull(_zipuHttpClient); + Assert.NotNull(_siliconflowHttpClient); } #endregion #region 音频 + /// + /// 创建语音 + /// + /// [Fact] - public async Task Audio_Test() + public async Task Audio_CreateSpeech_Test() { var requetData = new { //语音模型 - model = "gpt-4o-mini-tts", + model = "tts-1-1106", //要生成音频的文本。最大长度为4096个字符。 - input = "你好,上海今天的天气非常好,很适合户外游玩!", + input = """ + 断章 + 作者:卞之琳 + 你站在桥上看风景, + 看风景人在楼上看你。 + 明月装饰了你的窗子, + 你装饰了别人的梦。 + + """, //生成音频时使用的语音。支持的语音有:alloy、echo、fable、onyx、nova 和 shimmer。 - voice = "alloy", + voice = "nova", //默认为 mp3 音频的格式。支持的格式有:mp3、opus、aac 和 flac。 response_format = "mp3", @@ -77,7 +92,7 @@ namespace OllamaStudy.UseExtensionsAI speed = 1.0f, }; - using var requestMessage = new HttpRequestMessage(HttpMethod.Post, "https://sg.uiuiapi.com/v1/audio/speech") + using var requestMessage = new HttpRequestMessage(HttpMethod.Post, "v1/audio/speech") { Content = JsonContent.Create(requetData) }; @@ -86,17 +101,280 @@ namespace OllamaStudy.UseExtensionsAI responseMessage.EnsureSuccessStatusCode(); //处理响应 + //var responseText = await responseMessage.Content.ReadAsStringAsync(); var responseObject = await responseMessage.Content.ReadAsByteArrayAsync(); using FileStream stream = File.OpenWrite($"{Guid.NewGuid()}.mp3"); stream.Write(responseObject); } + + /// + /// 创建转录 + /// + /// + [Fact] + public async Task Audio_CreateTranscriptions_Test() + { + var formData = new MultipartFormDataContent(); + + // 读取文件流 + using var fileStream = File.OpenRead("Assets/dongdong.mp3"); + + // 创建文件内容并添加到表单 + var fileContent = new StreamContent(fileStream); + + //(必须) 要转录的音频文件对象(不是文件名),格式为:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm + formData.Add(fileContent, "file","dongdong.mp3"); + + //(必须) 要使用的模型 ID。目前只有 whisper-1 是可用的 + formData.Add(new StringContent("whisper-1"), "model"); + + //(可选) 输入音频的语言。以 ISO-639-1 格式提供输入语言可以提高准确性和延迟 + formData.Add(new StringContent("zh"), "language"); + + //(可选) 一个可选的文本来指导模型的风格或继续之前的音频段落。提示应该与音频语言匹配。 + formData.Add(new StringContent("请使用严肃风格"), "prompt"); + + //(可选) 转录输出的格式,默认为 json,可选择:json、text、srt、verbose_json 或 vtt。 + formData.Add(new StringContent("json"), "response_format"); + + //(可选) 采样温度,between 0 和 1。更高的值像 0.8 会使输出更随机,而更低的值像 0.2 会使其更集中和确定性。如果设置为 0,模型将使用对数概率自动增加温度直到达到特定阈值。 + //默认为 0 + formData.Add(new StringContent("0"), "temperature"); + + using var requestMessage = new HttpRequestMessage(HttpMethod.Post, "v1/audio/transcriptions") + { + Content = formData, + }; + + var responseMessage = await _uiUiAPIHttpClient.SendAsync(requestMessage); + responseMessage.EnsureSuccessStatusCode(); + + //处理响应 + var responseText = await responseMessage.Content.ReadAsStringAsync(); + _output.WriteLine(responseText); + + Assert.NotNull(responseText); + Assert.Contains("杀戮", responseText); + } + + /// + /// 创建翻译 + /// + /// + [Fact] + public async Task Audio_CreateTranslations_Test() + { + var formData = new MultipartFormDataContent(); + + // 读取文件流 + using var fileStream = File.OpenRead("Assets/dongdong.mp3"); + + // 创建文件内容并添加到表单 + var fileContent = new StreamContent(fileStream); + + //(必须) 要转录的音频文件对象(不是文件名),格式为:flac、mp3、mp4、mpeg、mpga、m4a、ogg、wav 或 webm + formData.Add(fileContent, "file", "dongdong.mp3"); + + //(必须) 要使用的模型 ID。目前只有 whisper-1 是可用的 + formData.Add(new StringContent("whisper-1"), "model"); + + //(可选) 一个可选的文本,用于指导模型的风格或继续之前的音频段落。提示文本应该是英文。 + formData.Add(new StringContent("Please use a serious style"), "prompt"); + + //(可选) 转录输出的格式,默认为 json,可选择:json、text、srt、verbose_json 或 vtt。 + formData.Add(new StringContent("json"), "response_format"); + + //(可选) 采样温度,between 0 和 1。更高的值像 0.8 会使输出更随机,而更低的值像 0.2 会使其更集中和确定性。如果设置为 0,模型将使用对数概率自动增加温度直到达到特定阈值。 + //默认为 0 + formData.Add(new StringContent("0"), "temperature"); + + using var requestMessage = new HttpRequestMessage(HttpMethod.Post, "/v1/audio/translations") + { + Content = formData, + }; + + var responseMessage = await _uiUiAPIHttpClient.SendAsync(requestMessage); + responseMessage.EnsureSuccessStatusCode(); + + //处理响应 + var responseText = await responseMessage.Content.ReadAsStringAsync(); + _output.WriteLine(responseText); + + Assert.NotNull(responseText); + Assert.Contains("killed", responseText); + } + #endregion #region 聊天 + #endregion #region 自动补全 + /// + /// 流式生成请求 测试 + /// + [Fact] + public async Task Completion_Request_Streaming_Test() + { + var requetData = new + { + model = _ollamaOptionsMonitor.CurrentValue.Model, + prompt = """天空为什么是蓝色的?""", + }; + + using var request = new HttpRequestMessage(HttpMethod.Post, "/v1/completions") + { + Content = JsonContent.Create(requetData) + }; + + //发送请求:流式处理响应,HttpCompletionOption.ResponseHeadersRead 是关键,只在SendAsync方法中有此参数 + var response = await _ollamaHttpClient.SendAsync(request, HttpCompletionOption.ResponseHeadersRead); + response.EnsureSuccessStatusCode(); + + //处理响应 + using var responseStream = await response.Content.ReadAsStreamAsync(); + using var reader = new StreamReader(responseStream); + + //如果是流式响应,则逐行读取 + while (!reader.EndOfStream) + { + var line = await reader.ReadLineAsync(); + _output.WriteLine(line); + } + } + + /// + /// 非流式生成请求 测试 + /// + /// + [Fact] + public async Task Completion_Request_NoStreaming_Test() + { + var requetData = new + { + model = _ollamaOptionsMonitor.CurrentValue.Model, + prompt = """天空为什么是蓝色的?""", + + //流式处理响应: 设置为 false 禁用流式处理 + stream = false, + }; + + using var requestMessage = new HttpRequestMessage(HttpMethod.Post, "/v1/completions") + { + Content = JsonContent.Create(requetData) + }; + + var responseMessage = await _ollamaHttpClient.SendAsync(requestMessage); + responseMessage.EnsureSuccessStatusCode(); + + //处理响应 + var responseText = await responseMessage.Content.ReadAsStringAsync(); + + Assert.NotNull(responseText); + _output.WriteLine(responseText); + } + + /// + /// 全参数生成请求 测试 + /// + /// + [Fact] + public async Task Completion_Request_FullParameters_Test() + { + var requetData = new + { + //(必需)模型名(标识):model:tag格式,model可具有可选的命名空间,tag是可选的,用于标识模型,默认为 latest + model = ModelSelecter.ModelWithSuffixAndImage, + + //(必需)生成响应的提示词:关键 + prompt = """ 天空为什么是蓝色的?""", + + //(可选)默认为1 在服务器端生成best_of个补全,并返回“最佳”补全(每个令牌的日志概率最高的那个)。 + //无法流式传输结果。 与n一起使用时,best_of控制候选补全的数量,n指定要返回的数量 – best_of必须大于n。 + //注意:因为这个参数会生成许多补全,所以它可以快速消耗您的令牌配额。请谨慎使用,并确保您对max_tokens和stop有合理的设置。 + best_of = 1, + + //(可选)默认为false 除了补全之外,还回显提示 + echo = false, + + //(可选)默认为0 -2.0和2.0之间的数字。正值根据文本目前的现有频率处罚新令牌,降低模型逐字重复相同行的可能性。 + frequency_penalty = 0f, + + //(可选)默认为null 修改完成中指定令牌出现的可能性。 + //接受一个JSON对象,该对象将令牌(由GPT令牌化器中的令牌ID指定)映射到关联偏差值,-100到100。 + //您可以使用这个令牌化器工具(适用于GPT-2和GPT-3)将文本转换为令牌ID。从数学上讲,偏差在对模型进行采样之前添加到生成的logit中。 + //确切效果因模型而异,但-1至1之间的值应降低或提高选择的可能性;像-100或100这样的值应导致相关令牌的禁用或专属选择。 + //例如,您可以传递{"50256": -100}来防止生成<|endoftext|>令牌。 + logit_bias = default(object), + + //(可选)默认为null + //包括logprobs个最可能令牌的日志概率,以及所选令牌。例如, + //如果logprobs为5,API将返回5个最有可能令牌的列表。 API总会返回采样令牌的logprob,因此响应中最多可能有logprobs + 1个元素。logprobs的最大值是5。 + logprobs = default(object), + + //(可选)默认为16 + //在补全中生成的最大令牌数。提示的令牌计数加上max_tokens不能超过模型的上下文长度。 计数令牌的Python代码示例。 + max_tokens = 16, + + //(可选)默认为1 + //为每个提示生成的补全数量。注意:因为这个参数会生成许多补全,所以它可以快速消耗您的令牌配额。 + //请谨慎使用,并确保您对max_tokens和stop有合理的设置。 + n =1, + + //(可选)默认为0 + //-2.0和2.0之间的数字。正值根据它们是否出现在目前的文本中来惩罚新令牌,增加模型讨论新话题的可能性。 有关频率和存在惩罚的更多信息,请参阅。 + presence_penalty = 0f, + + //(可选) + //如果指定,我们的系统将尽最大努力确定性地进行采样,以便使用相同的种子和参数的重复请求应返回相同的结果。 + //不保证确定性,您应该参考system_fingerprint响应参数来监视后端的更改。 + seed = 654321, + + //(可选)默认为null + //最多4个序列,API将停止在其中生成更多令牌。返回的文本不会包含停止序列。 + stop = default(string), + + //(可选)流式处理响应: 可通过设置 false 来禁用流式处理 + stream = true, + + //(可选)默认为null + //在插入文本的补全之后出现的后缀。 + //模型响应后的文本:只有专用模型才支持(qwen2.5-coder:3b等), 模型不支持则异常 + //suffix = " return result", + + //(可选)默认为1 要使用的采样温度,介于0和2之间。更高的值(如0.8)将使输出更随机,而更低的值(如0.2)将使其更集中和确定。 + //我们通常建议更改这个或top_p,而不是两者都更改。 + temperature = 1f, + + //表示最终用户的唯一标识符,这可以帮助OpenAI监控和检测滥用。 了解更多。 + user = "mynameisok", + + //较高的值(例如 0.95)将导致文本更加多样化,而较低的值(例如 0.5)将生成更集中和保守的文本。(默认值:0.9) + top_p = 0.9f, + }; + + using var request = new HttpRequestMessage(HttpMethod.Post, "/v1/completions") + { + Content = JsonContent.Create(requetData) + }; + + //发送请求:流式处理响应,HttpCompletionOption.ResponseHeadersRead 是关键,只在SendAsync方法中有此参数 + var response = await _ollamaHttpClient.SendAsync(request, HttpCompletionOption.ResponseHeadersRead); + response.EnsureSuccessStatusCode(); + + //处理响应 + using var responseStream = await response.Content.ReadAsStreamAsync(); + using var reader = new StreamReader(responseStream); + + //如果是流式响应,则逐行读取 + while (!reader.EndOfStream) + { + var line = await reader.ReadLineAsync(); + _output.WriteLine(line); + } + } #endregion #region 嵌入 @@ -117,8 +395,51 @@ namespace OllamaStudy.UseExtensionsAI /// 列出模型 测试 /// [Fact] - public void List_Models_Test() + public async Task List_Models_Test() { + var responseMessage = await _ollamaHttpClient.GetAsync("/v1/models"); + responseMessage.EnsureSuccessStatusCode(); + + var resultObj = new + { + @object = "list", + data = new[] { new { id="model_id", @object = "model", created = 1754931997, owned_by = "library" } } + }; + + //处理响应 + var responseObject = await responseMessage.Content.ReadAsStringAsync(); + + var modelObj = Newtonsoft.Json.JsonConvert.DeserializeAnonymousType(responseObject,resultObj); + + Assert.NotNull(modelObj); + + foreach (var model in modelObj.data) + { + _output.WriteLine($"模型ID:{model.id}, 模型名称:{model.@object}, 创建:{model.created}, 创建者:{model.owned_by}"); + } + + } + + /// + /// 检索模型 测试 + /// + [Theory] + [InlineData(ModelSelecter.ModelWithTool)] + public async Task Query_Model_Test(string modelName) + { + var responseMessage = await _ollamaHttpClient.GetAsync($"/v1/models/{modelName}"); + responseMessage.EnsureSuccessStatusCode(); + + var resultObj = new { id = "model_id", @object = "model", created = 1754931997, owned_by = "library" }; + + //处理响应 + var responseObject = await responseMessage.Content.ReadAsStringAsync(); + + var model = Newtonsoft.Json.JsonConvert.DeserializeAnonymousType(responseObject, resultObj); + + Assert.NotNull(model); + + _output.WriteLine($"模型ID:{model.id}, 模型名称:{model.@object}, 创建:{model.created}, 创建者:{model.owned_by}"); } #endregion diff --git a/OllamaStudy.UseExtensionsAI/Startup.cs b/OllamaStudy.UseExtensionsAI/Startup.cs index 191b5ae..eda6d7c 100644 --- a/OllamaStudy.UseExtensionsAI/Startup.cs +++ b/OllamaStudy.UseExtensionsAI/Startup.cs @@ -164,7 +164,7 @@ namespace OllamaStudy.UseExtensionsAI services .AddHttpClient("UiUiAPIHttpClient", (provider, client) => { - client.BaseAddress = new Uri("https://sg.uiuiapi.com/v1"); + client.BaseAddress = new Uri("https://sg.uiuiapi.com"); client.DefaultRequestHeaders.Add("Authorization", $"Bearer sk-4azuOUkbzNGP22pQkND8ad1vZl7ladwBQyqGKlWWZyxYgX1L"); //client.DefaultRequestHeaders.Add("Content-Type", "application/json"); client.Timeout = TimeSpan.FromSeconds(60); @@ -172,7 +172,7 @@ namespace OllamaStudy.UseExtensionsAI .UseSocketsHttpHandler((socketHttpHandeler, serviceProvider) => { //配置请求代理:请求走 Fiddler 代理,便于调试 - socketHttpHandeler.Proxy = new System.Net.WebProxy("http://127.0.0.1:8888"); + //socketHttpHandeler.Proxy = new System.Net.WebProxy("http://127.0.0.1:8888"); }); //阿里百炼 HttpClient @@ -181,7 +181,7 @@ namespace OllamaStudy.UseExtensionsAI { //var options = provider.GetRequiredService>().CurrentValue; - client.BaseAddress = new Uri("https://dashscope.aliyuncs.com/compatible-mode/v1"); + client.BaseAddress = new Uri("https://dashscope.aliyuncs.com"); client.DefaultRequestHeaders.Add("Authorization", $"Bearer sk-0122f39e383546b9a0999f70b9ef99e3"); client.Timeout = TimeSpan.FromSeconds(60); }); @@ -192,14 +192,30 @@ namespace OllamaStudy.UseExtensionsAI { //var options = provider.GetRequiredService>().CurrentValue; - client.BaseAddress = new Uri("https://open.bigmodel.cn/api/paas/v4/"); + client.BaseAddress = new Uri("https://open.bigmodel.cn"); client.DefaultRequestHeaders.Add("Authorization", $"Bearer 397a799102a6453282da8abb2a1b2581.8fTMHZGRkPHJya4R"); client.Timeout = TimeSpan.FromSeconds(60); }) .UseSocketsHttpHandler((socketHttpHandeler, serviceProvider) => { //配置请求代理:请求走 Fiddler 代理,便于调试 - socketHttpHandeler.Proxy = new System.Net.WebProxy("http://127.0.0.1:8888"); + //socketHttpHandeler.Proxy = new System.Net.WebProxy("http://127.0.0.1:8888"); + }); + + //硅基流动 HttpClient + services + .AddHttpClient("SiliconflowHttpClient", (provider, client) => + { + //var options = provider.GetRequiredService>().CurrentValue; + + client.BaseAddress = new Uri("https://api.siliconflow.cn"); + client.DefaultRequestHeaders.Add("Authorization", $"Bearer sk-ylwuqfmfkgvjaarwdpxqrguhcqbsnfzhyregbolpumeqyniy"); + client.Timeout = TimeSpan.FromSeconds(60); + }) + .UseSocketsHttpHandler((socketHttpHandeler, serviceProvider) => + { + //配置请求代理:请求走 Fiddler 代理,便于调试 + //socketHttpHandeler.Proxy = new System.Net.WebProxy("http://127.0.0.1:8888"); }); } #endregion diff --git a/OllamaStudy.UseOllamaSharp/OllamaApiTest.cs b/OllamaStudy.UseOllamaSharp/OllamaApiTest.cs index b9d4313..8682ab9 100644 --- a/OllamaStudy.UseOllamaSharp/OllamaApiTest.cs +++ b/OllamaStudy.UseOllamaSharp/OllamaApiTest.cs @@ -80,7 +80,7 @@ namespace OllamaStudy.UseOllamaSharp } /// - /// 流式生成请求 + /// 非流式生成请求 /// [Fact] public async Task Completion_Request_NoStreaming_Test()