Local LLM

Pusat blog

Blog Local LLM

Panduan praktis tentang VRAM, Mac, kuantisasi, model coding, dan model vision lokal.

Panduan Memori Video

Model lokal besar apa yang dapat dijalankan dengan memori grafis berbeda?

Dari 6 GB, 8 GB, 12 GB, 24 GB hingga 48 GB, jelaskan bagaimana volume parameter model, versi terkuantisasi, cache KV, dan overhead sistem digabungkan untuk menentukan apakah volume tersebut dapat dimuat.

Baca artikel

chip apel

Bagaimana Apple Unified Memory memengaruhi LLM lokal?

Jelaskan mengapa total memori di Mac tidak dapat digunakan sebagai memori video, dan cara memilih model yang sesuai untuk mesin 16 GB, 32 GB, 64 GB, dan 128 GB.

Baca artikel

Mengukur

Q4, Q5, Q6, Q8 Bagaimana cara memilih kuantifikasi?

Kuantifikasi GGUF yang lebih umum atas penggunaan memori, kehilangan kualitas, dan trade-off kecepatan membantu pengguna memahami tiga preferensi yaitu prioritas kualitas, keseimbangan, dan konteks panjang.

Baca artikel

model pemrograman

Bagaimana memilih LLM lokal yang cocok untuk pemrograman?

Dari empat skenario pembuatan kode, interpretasi, rekonstruksi dan konteks panjang, jelaskan mengapa tujuan pemrograman tidak bisa hanya melihat ukuran model dan volume unduhan.

Baca artikel

multimodal

Bagaimana menjalankan model visi lokal dan model multimodal?

Artikel ini memperkenalkan masalah tambahan memori grafis, encoder gambar, konteks, dan dukungan back-end penalaran yang perlu dipertimbangkan dalam model visual dibandingkan dengan model teks.

Baca artikel

Pemilihan alat

Apa perbedaan antara Ollama, LM Studio, dan llama.cpp?

Jelaskan kepada pengguna biasa tentang pengalaman instalasi, manajemen model, penyetelan kinerja, dan kelompok yang berlaku dari tiga metode pengoperasian lokal yang umum.

Baca artikel