ai.php 1.4 KB

123456789101112131415161718192021222324
  1. <?php
  2. /**
  3. * config/ai.php
  4. *
  5. * LLM backend configuration.
  6. * Primary: llama.cpp server (faster, local GPU inference)
  7. * Fallback: Ollama (used if llama.cpp is unreachable)
  8. */
  9. // ── llama.cpp (primary) ───────────────────────────────────────────────────────
  10. define('LLAMACPP_HOST', 'http://192.168.8.73:11433'); // adjust to your llama.cpp server
  11. define('LLAMACPP_TIMEOUT', 120); // seconds
  12. define('LLAMACPP_TEMPERATURE', 100);
  13. define('LLAMACPP_TOP_P', 0.95);
  14. define('LLAMACPP_TOP_K', 40);
  15. // ── Ollama (fallback) ─────────────────────────────────────────────────────────
  16. define('OLLAMA_HOST', 'http://192.168.8.73:11434');
  17. define('OLLAMA_MODEL', 'llama3.1:8b-instruct-q4_K_M');
  18. define('OLLAMA_TIMEOUT', 60); // seconds — field mapping is fast
  19. define('OLLAMA_TEMPERATURE', 0.1); // low temp for deterministic JSON output
  20. // ── Shared ────────────────────────────────────────────────────────────────────
  21. define('EMBED_MODEL', 'nomic-embed-text'); // Ollama embedding model (fallback)