使用 Python 调教 OpenAI ，让 AI 回答的更完美

站长

2024年03月12日 22:05 · 阅读数 52

在这个快速发展的数字时代，AI人工智慧已经渐渐成为我们日常生活的一部分。而OpenAI，作为AI研究的机构之一，提供了强大的工具和LLM模型，如GPT-3.5、GPT-4，来帮助我们更好地理解和使用AI。

在本文中，将以简单明了的方式来说明如何控制OpenAI模型的一些关键设定。从生成多样回复的 n 参数，到控制回答长度的 max_tokens ，再到建立词汇黑名单的 stop 参数，以及最后的 temperature 参数，这些都是让AI生成的内容更加贴合我们需求的实用工具。让我们一起探索这个令人兴奋的AI世界。

如何用OpenAI获得多个答案？

使用参数 n 可选择多个答案。

当我们使用ChatGPT时，通常我们会得到一个答案。但如果你对这个答案不太满意怎么办？有时候，我们希望能看到不同的答案，从中选择一个最适合的。这时候你需要在答案的下方按下「重新生成」按钮，让ChatGPT重新生成一组新的回答。

使用 Python 调教 OpenAI ，让 AI 回答的更完美

ChatGPT的状况

好消息是在OpenAI，我们可以让它一次给我们好几个答案作为选择。这就是 n 这个参数的作用。通过设置 n 参数，我们可以告诉OpenAI一次生成多少个答案。比如说，设置 n = 3 就会一次得到三个不同的答案。

但要注意，这些答案都是针对同一个问题，回答的不同回答，而不是一来一回的连续对话。

如何做？

假设你使用Python语言来跟OpenAI沟通，可以这样写：

 openai<=1.0.0 时

reply = openai.ChatCompletion.create(
 model= "gpt-3.5-turbo",
 messages = [{"role": "user", "content": "今天是个晴朗的天气吧"}],
 n = 2        
)

print(reply)

for choice in reply["choices"]:
    print(choice["index"], choice["messages"]["content"])


 openai>=1.0.0 时

reply = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[{"role": "user", "content": "今天是个晴朗的天气吧"}],
  n=2
)

pprint(reply)

for choice in reply.choices:
    print(choice.index, choice.message.content)

这段程序会让OpenAI给我们两个不同的回答。我们透过一个for loop 回圈把这些回答一个一个显示出来。每个回答都有一个编号，从0开始。

使用 Python 调教 OpenAI ，让 AI 回答的更完美

这样你就可以看到两个不同的答案了。不过，这里必需要记得的一点是，当我们要求更多的答案时，使用的 token 数量也会增加。token 是OpenAI计算使用量的单位，所以多个答案意味着可能需要付出更多费用。

如何设定OpenAI回答的长度限制？

使用max_tokens参数，控制回复内容长度

回答的答案越长，所用到的 token 数越多，连带的费用也会越高。因此，有时候我们在使用OpenAI时不希望模型给我们太长的回答，以便于节省成本。这时，我们可以使用一个叫做 max_tokens 的设定来限制回复的长度，控制 token 的使用数量。以下用两个例子说明：

举例 1

比如说，我们只想要一个很短的回答，可以这样设定：

 openai<=1.0.0 时

reply = openai.ChatCompletion.create(
 model= "gpt-3.5-turbo",
 messages = [{"role": "user", "content": "冬天为何会下雪？"}],
 max_tokens = 10        
)

print(reply["choices"][0]["message"]["content"])
print(reply["choices"][0]["finish_reason"])
print(reply["usage"]["completion_tokens"])

 openai>=1.0.0 时

reply = client.chat.completions.create(
    model = "gpt-3.5-turbo",
    messages = [
        {"role":"user", "content": "冬天为何会下雪？"}
    ],
    max_tokens = 10
)

print(reply.choices[0].message.content)
print(reply.choices[0].finish_reason)
print(reply.usage.completion_tokens)

这样设定后，OpenAI只会回答一个很短的句子，大概10个词（tokens）左右。显然，这个回答不可能完整，因为 max_tokens 限制了它的长度。我们可以看到 finish_reason 的结果为length，就可以得知，这次的回答是因为长度受到限制而停止，回答并不完整。

使用 Python 调教 OpenAI ，让 AI 回答的更完美

举例 2

还有，我们必须注意不要设定一个太大的 max_tokens 值。例如，gpt-3.5-turbo模型最多能处理4097个 token 。如果设定的 max_tokens 太大，超过这个范围，API就会出现错误，因为它超出了模型的处理能力。

 openai<=1.0.0 时

reply = openai.ChatCompletion.create(
 model= "gpt-3.5-turbo",
 messages = [{"role": "user", "content": "冬天为何会下雪？"}],
 max_tokens = 4090        
)

print(reply["choices"][0]["message"]["content"])
print(reply["choices"][0]["finish_reason"])
print(reply["usage"]["completion_tokens"])

 openai>=1.0.0 时

reply = client.chat.completions.create(
    model = "gpt-3.5-turbo",
    messages = [
        {"role":"user", "content": "冬天为何会下雪？"}
    ],
    max_tokens = 4090
)

print(reply.choices[0].message.content)
print(reply.choices[0].finish_reason)
print(reply.usage.completion_tokens)

执行这个例子，会产生如下的结果。告诉我们这个模型最多只能处理4097个 token ，但是我们却设定了超过这个限制的 token 数（ This model’s maximum context length is 4097 tokens. However, you requested 4110 tokens (20 in the messages, 4090 in the completion）

使用 Python 调教 OpenAI ，让 AI 回答的更完美

总体来说， max_tokens 是一个很有用的设定，可以帮我们控制回答的长度，进而控制用量与成本。反之，由于它的默认值为无限大，若没有特别设定 max_tokens 的话，就没有任何限制。因此要记得，设定得太高或太低都可能会影响回答的质量。

如何设定OpenAI模型回答的禁用语？

stop参数，可建立词汇黑名单

当我们使用OpenAI的时候，可能会担心它的回答中出现一些我们不想要的词汇。那么，我们怎么才能避免这种情况呢？这时候，OpenAI提供我们一个叫做 stop 的参数来设定黑名单。

stop 参数可以让我们指定一些不想让AI使用的词汇。默认情况下，这个 list列表是空的，这也就意味着没有任何词汇被禁止。

我们最多可以在这个列表中设定四个词汇。一旦AI在回答中遇到这些词汇时，就会立刻停止回答，并返回目前的结果。以下举例说明：

举例

假如我们不希望回答中出现「好」这个字词，我们可以透过下面方式设定：

 openai<=1.0.0 时

reply = openai.ChatCompletion.create(
 model= "gpt-3.5-turbo",
 messages = [{"role": "user", "content": "我很好，您好吗？"}],
 stop = ["好"]        
)

print(reply["choices"][0]["message"]["content"])
print(reply["choices"][0]["finish_reason"])



 openai>=1.0.0 时

reply = client.chat.completions.create(
  model="gpt-3.5-turbo",
  messages=[{"role": "user", "content": "我很好，您好吗？"}],
  stop=['好']
)

print(reply.choices[0].message.content)
print(reply.choices[0].finish_reason)

我们将stop参数设定为「好」（ stop = [“好”] ）。这样一来，如果AI的回答中包含了「好」这个字词，它就会立即停止回答。这个功能对于控制AI回答的内容非常有用，可以确保不会出现不适当或不想看到的词汇。

如何通过「温度」设定让OpenAI回答更有趣

temperature参数，可增加回答的多样性

「temperature」这个参数就像是调节OpenAI回答的「温度」设定器。当我们讲温度时，高温通常意味著更多活力和热情，而低温则意味著冷静和稳定。这个概念也适用于OpenAI的设定。通过调整 temperature ，我们可以控制AI回答的随机性和创造性。这个参数的范围从0到2，数值越高，回答就越多变和有趣；数值越低，回答就越稳定和可预测。

设定为最低值：0

当我们把 temperature 设为0时：

reply = client.chat.completions.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": "嗨！我很好，您好吗？"}],
temperature=0,
n=2
)
for choice in reply.choices:
 print(choice.index, choice.message.content)

这样设定后，如下图所示：

使用 Python 调教 OpenAI ，让 AI 回答的更完美

AI产生的回答会非常稳定和一致，几乎没有太多变化。

设定为最高值：2

反之，如果将 temperature 设为2：

reply = client.chat.completions.create(
model="gpt-3.5-turbo",
messages=[{"role": "user", "content": "嗨！我很好，您好吗？"}],
temperature=2,
n=2
)
for choice in reply.choices:
 print(choice.index, choice.message.content)

在这个设定下，AI产生的回答会非常活泼和多变，有时甚至可能显得有点奇怪或不相关（如下图显示）。而且，这可能会导致AI需要更长的时间来生成回答。

使用 Python 调教 OpenAI ，让 AI 回答的更完美

实际上， temperature 的默认值是1。在这个设定下的回答既不会太僵硬，也不会太过活跃，是一个较为均衡的选择。因此，如果你不确定从哪里开始，可以先尝试设定 temperature 为1开始测试。

结语

透过本文的介绍，我们一起探索了如何控制OpenAI模型的几个重要设定。从设定生成回复数量的 n 参数，到控制回答长度的 max_tokens ，再到建立词汇黑名单的 stop 参数，以及调节回答风格的 temperature ，这些都是使我们能够更有效地利用AI技术的强大工具。这些设定，让我们可以调整与控制AI的回答，使之更贴合我们的需求和预期，无论是在节省成本、避免不适当内容，还是创造更有趣和多样的回答上都大有裨益。

希望这篇文章能够帮助您对OpenAI的功能有了更深入的理解，无论目前的您是AI领域的初学者还是已经有一定经验的使用者。在这个不断变化的AI领域，保持学习和实验的心是非常重要的。随著技术的进步，你我将会看到更多令人叹为观止的可能性。期待AI在未来的发展，并积极参与其中，共同塑造一个更智能、更有效的未来。

转载自:https://juejin.cn/post/7330021813823324175