> ## Documentation Index
> Fetch the complete documentation index at: https://veniceai-mintlify-d2fddb8a.mintlify.site/llms.txt
> Use this file to discover all available pages before exploring further.

# نماذج التفكير المنطقي

> استدعِ نماذج التفكير المنطقي في Venice التي تكشف tokens سلسلة التفكير، وتتحكم في جهد التفكير، وتُظهر إجابات خطوة بخطوة في chat completions.

تفكر بعض النماذج بصوت عالٍ قبل الإجابة. تعمل على المشكلات خطوة بخطوة، ثم تعطيك إجابة نهائية. هذا يجعلها أقوى في الرياضيات والشفرة والمهام كثيفة المنطق.

<div id="reasoning-models-placeholder" />

اطلع على القائمة الكاملة للنماذج والأسعار وحدود السياق في [صفحة النماذج](/overview/models). لا تدعم جميع نماذج التفكير المنطقي معامل [`reasoning_effort`](#reasoning-effort). انظر [دعم النموذج](#model-support) للتفاصيل.

## قراءة المخرجات

تعيد نماذج التفكير المنطقي تفكيرها في حقل `reasoning_content` منفصل، مع الحفاظ على `content` نظيفًا:

<CodeGroup>
  ```python Python theme={null}
  response = client.chat.completions.create(
      model="zai-org-glm-5-1",
      messages=[{"role": "user", "content": "What is 15% of 240?"}]
  )

  thinking = response.choices[0].message.reasoning_content
  answer = response.choices[0].message.content
  ```

  ```javascript Node.js theme={null}
  const response = await client.chat.completions.create({
      model: "zai-org-glm-5-1",
      messages: [{ role: "user", content: "What is 15% of 240?" }]
  });

  const thinking = response.choices[0].message.reasoning_content;
  const answer = response.choices[0].message.content;
  ```

  ```bash cURL theme={null}
  curl https://api.venice.ai/api/v1/chat/completions \
    -H "Authorization: Bearer $VENICE_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "model": "zai-org-glm-5-1",
      "messages": [{"role": "user", "content": "What is 15% of 240?"}]
    }'
  ```
</CodeGroup>

<Info>
  يعيد بعض المزودين (Anthropic، Google، OpenAI، Qwen) tokens تفكير مشفرة أو ملخصة. عندما يحدث هذا، يحتوي `reasoning_content` على عنصر نائب `"[Some reasoning content is encrypted]"`.
</Info>

### البث

عند البث، يصل `reasoning_content` في الـ delta قبل الإجابة النهائية:

<CodeGroup>
  ```python Python theme={null}
  stream = client.chat.completions.create(
      model="zai-org-glm-5-1",
      messages=[{"role": "user", "content": "Explain photosynthesis"}],
      stream=True
  )

  for chunk in stream:
      if chunk.choices:
          delta = chunk.choices[0].delta
          if delta.reasoning_content:
              print(delta.reasoning_content, end="")
          if delta.content:
              print(delta.content, end="")
  ```

  ```javascript Node.js theme={null}
  const stream = await client.chat.completions.create({
      model: "zai-org-glm-5-1",
      messages: [{ role: "user", content: "Explain photosynthesis" }],
      stream: true
  });

  for await (const chunk of stream) {
      if (chunk.choices?.[0]?.delta) {
          const delta = chunk.choices[0].delta;
          if (delta.reasoning_content) process.stdout.write(delta.reasoning_content);
          if (delta.content) process.stdout.write(delta.content);
      }
  }
  ```

  ```bash cURL theme={null}
  curl https://api.venice.ai/api/v1/chat/completions \
    -H "Authorization: Bearer $VENICE_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "model": "zai-org-glm-5-1",
      "messages": [{"role": "user", "content": "Explain photosynthesis"}],
      "stream": true
    }'
  ```
</CodeGroup>

## جهد التفكير المنطقي

يتحكم معامل `reasoning_effort` في مقدار التفكير الذي يقوم به النموذج قبل الاستجابة. الجهد الأعلى يعني تفكيرًا أعمق ولكن مزيدًا من الـ tokens وزمن الاستجابة.

### القيم المقبولة

| القيمة    | الوصف                              |
| --------- | ---------------------------------- |
| `none`    | يعطل التفكير المنطقي تمامًا        |
| `minimal` | تفكير منطقي أساسي بأقل جهد         |
| `low`     | تفكير منطقي خفيف للمشكلات البسيطة  |
| `medium`  | تفكير منطقي متوازن للتعقيد المعتدل |
| `high`    | تفكير منطقي عميق للمشكلات المعقدة  |
| `xhigh`   | عمق تفكير منطقي عالٍ جدًا          |
| `max`     | الحد الأقصى لقدرة التفكير المنطقي  |

<Warning>
  لا تدعم جميع النماذج جميع القيم. **لا** تقوم Venice بالتخطيط التلقائي إلى أقرب مستوى مدعوم. القيم غير المدعومة تعيد خطأ 400 من المزود الأساسي. على سبيل المثال، إرسال `xhigh` إلى Claude أو `max` إلى GPT-5.2 سيفشل.

  عند الشك، استخدم `low` أو `medium` أو `high`. هذه هي القيم الأكثر دعمًا على نطاق واسع.
</Warning>

### دعم النموذج

#### OpenAI

| النموذج                      | القيم المدعومة                           |
| ---------------------------- | ---------------------------------------- |
| GPT-5.2                      | `none`, `low`, `medium`, `high`, `xhigh` |
| GPT-5.2 Codex, GPT-5.3 Codex | `low`, `medium`, `high`, `xhigh`         |

#### Anthropic

| النموذج                                 | القيم المدعومة                 |
| --------------------------------------- | ------------------------------ |
| Claude Opus 4.6, Opus 4.6 Fast          | `low`, `medium`, `high`, `max` |
| Claude Opus 4.5, Sonnet 4.5, Sonnet 4.6 | `low`, `medium`, `high`        |

#### Google

| النموذج                | القيم المدعومة                     |
| ---------------------- | ---------------------------------- |
| Gemini 3 Pro Preview   | `low`, `high`                      |
| Gemini 3.1 Pro Preview | `low`, `medium`, `high`            |
| Gemini 3 Flash Preview | `minimal`, `low`, `medium`, `high` |

#### xAI

نماذج Grok (Grok 4.1 Fast، Grok Code Fast) **لا** تدعم `reasoning_effort`. تحديده سيؤدي إلى خطأ.

#### نماذج أخرى

| النموذج                                     | القيم المدعومة                         |
| ------------------------------------------- | -------------------------------------- |
| Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B | `low`, `medium`, `high`                |
| Kimi K2.5                                   | `low`, `medium`, `high`                |
| MiniMax M2.5, M2.1                          | `low`, `medium`, `high`                |
| GLM 5.1 series                              | تفكير منطقي مدمج فقط، غير قابل للتكوين |
| DeepSeek R1                                 | تفكير منطقي مدمج فقط، غير قابل للتكوين |

### الاستخدام

مرر `reasoning_effort` كمعامل عالي المستوى أو استخدم تنسيق `reasoning.effort` المتداخل:

<CodeGroup>
  ```python Python theme={null}
  response = client.chat.completions.create(
      model="minimax-m25",
      messages=[{"role": "user", "content": "Prove that there are infinitely many primes"}],
      extra_body={"reasoning": {"effort": "high"}}
  )
  ```

  ```javascript Node.js theme={null}
  const response = await client.chat.completions.create({
      model: "minimax-m25",
      messages: [{ role: "user", content: "Prove that there are infinitely many primes" }],
      reasoning: { effort: "high" }
  });
  ```

  ```bash cURL theme={null}
  curl https://api.venice.ai/api/v1/chat/completions \
    -H "Authorization: Bearer $VENICE_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "model": "minimax-m25",
      "messages": [{"role": "user", "content": "Prove that there are infinitely many primes"}],
      "reasoning": {"effort": "high"}
    }'
  ```
</CodeGroup>

التنسيق المسطح `"reasoning_effort": "high"` مقبول أيضًا.

## تعطيل التفكير المنطقي

هناك طريقتان لتعطيل التفكير المنطقي:

| الطريقة                    | الصياغة                           | كيف تعمل                                                                                    |
| -------------------------- | --------------------------------- | ------------------------------------------------------------------------------------------- |
| `reasoning.enabled: false` | `"reasoning": {"enabled": false}` | مفتاح تبديل على مستوى Venice يمنع إرسال معاملات التفكير المنطقي إلى المزود. **موصى به.**    |
| `reasoning.effort: "none"` | `"reasoning": {"effort": "none"}` | يُمرَّر إلى المزود الذي يقرر كيفية التعامل معه. مدعوم فقط من قبل بعض النماذج (مثل GPT-5.x). |

للنماذج التي تدعمها، `reasoning.enabled: false` هو الخيار الأكثر موثوقية:

| النموذج                                      | يمكن تعطيله؟                   |
| -------------------------------------------- | ------------------------------ |
| GPT-5.2                                      | نعم                            |
| GPT-5.2 Codex, GPT-5.3 Codex                 | نعم (لكن جهد `none` غير مدعوم) |
| Qwen 3 235B A22B Thinking, Qwen 3.5 35B A3B  | نعم                            |
| GLM 5.1 series                               | نعم                            |
| Claude Opus 4.5/4.6/4.6 Fast, Sonnet 4.5/4.6 | لا (يفكر دائمًا)               |
| Gemini 3 Pro, 3.1 Pro, 3 Flash               | لا (يفكر دائمًا)               |
| DeepSeek R1                                  | لا (يفكر دائمًا)               |

<CodeGroup>
  ```python Python theme={null}
  response = client.chat.completions.create(
      model="openai-gpt-52",
      messages=[{"role": "user", "content": "What's the capital of France?"}],
      extra_body={"reasoning": {"enabled": False}}
  )
  ```

  ```javascript Node.js theme={null}
  const response = await client.chat.completions.create({
      model: "openai-gpt-52",
      messages: [{ role: "user", content: "What's the capital of France?" }],
      reasoning: { enabled: false }
  });
  ```

  ```bash cURL theme={null}
  curl https://api.venice.ai/api/v1/chat/completions \
    -H "Authorization: Bearer $VENICE_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "model": "openai-gpt-52",
      "messages": [{"role": "user", "content": "What is the capital of France?"}],
      "reasoning": {"enabled": false}
    }'
  ```
</CodeGroup>

## حدود الـ Tokens

تولد نماذج التفكير المنطقي tokens إجابة مرئية (في `content`) و tokens تفكير منطقي (في `reasoning_content`). كلاهما يحتسب من ميزانية الـ tokens الخاصة بك.

### تعيين حد للـ tokens

استخدم `max_completion_tokens` للحد من إجمالي عدد الـ tokens التي يولدها النموذج، بما في ذلك التفكير المنطقي:

```json theme={null}
{
  "model": "deepseek-v4-flash",
  "messages": [...],
  "max_completion_tokens": 500
}
```

`max_tokens` مقبول أيضًا ويتصرف بالطريقة نفسها. إذا تم تعيين كليهما، يأخذ `max_completion_tokens` الأسبقية.

للحصول على المزيد من المخرجات المرئية، ارفع الحد، أو خفّض `reasoning_effort`، أو [عطّل التفكير المنطقي](#disabling-reasoning).

### قراءة التفصيل

يُظهر كائن `usage` كيف أُنفقت ميزانيتك:

```json theme={null}
"usage": {
  "completion_tokens": 501,
  "completion_tokens_details": { "reasoning_tokens": 169 },
  "prompt_tokens": 13,
  "total_tokens": 514
}
```

في هذا المثال، تم إنفاق 169 token على التفكير المنطقي و 332 على الإجابة المرئية. عند الوصول إلى الحد، يكون `finish_reason` هو `length`.

الحد الأعلى لكل نموذج متاح كـ `maxCompletionTokens` على نقطة نهاية [`/v1/models`](/api-reference/endpoint/models/list).

### النماذج غير التفكيرية

يتصرف `max_tokens` و `max_completion_tokens` بنفس الطريقة على النماذج غير التفكيرية، إذ يحدّان مباشرة المخرجات المرئية.

## اكتشاف القدرات

تحقق مما يدعمه النموذج عبر نقطة نهاية [`/v1/models`](/api-reference/endpoint/models/list):

| الحقل                     | المعنى                                                     |
| ------------------------- | ---------------------------------------------------------- |
| `supportsReasoning`       | النموذج لديه قدرة تفكير منطقي (chain-of-thought)           |
| `supportsReasoningEffort` | النموذج يقبل معامل `reasoning_effort` / `reasoning.effort` |

## أفضل الممارسات

* استخدم الافتراضي `medium` للاستخدام العام
* استخدم `high` أو `xhigh` للمهام المعقدة (الرياضيات، الشفرة، التحليل)
* استخدم `low` للتطبيقات الحساسة لزمن الاستجابة
* استخدم `reasoning.enabled: false` أو عيّن الجهد إلى `none` لتعطيل التفكير المنطقي
* عند الشك، استخدم `low` أو `medium` أو `high`. هذه هي القيم الأكثر دعمًا على نطاق واسع