Local LLM

Блог

Блог Local LLM

Практические материалы о VRAM, Mac, квантовании, моделях для кода и локальных vision-моделях.

Руководство по видеопамяти

Какие локальные большие модели можно запускать с разной графической памятью?

От 6 ГБ, 8 ГБ, 12 ГБ, 24 ГБ до 48 ГБ объясните, как объем параметров модели, квантованная версия, кэш KV и системные издержки объединяются, чтобы определить, можно ли его загрузить.

Читать статью

Apple чип

Как Apple Unified Memory влияет на локальный LLM?

Объясните, почему всю память Mac нельзя использовать в качестве видеопамяти и как выбрать подходящую модель для компьютеров с памятью 16 ГБ, 32 ГБ, 64 ГБ и 128 ГБ.

Читать статью

Количественная оценка

Q4, Q5, Q6, Q8 Как мне выбрать количественную оценку?

Более распространенная количественная оценка GGUF использования памяти, потери качества и компромисса в скорости помогает пользователям понять три предпочтения: приоритет качества, баланс и длинный контекст.

Читать статью

модель программирования

Как выбрать местную LLM, подходящую для программирования?

Используя четыре сценария генерации кода, интерпретации, реконструкции и длинного контекста, объясните, почему в целях программирования нельзя просто учитывать размер модели и объем загрузки.

Читать статью

мультимодальный

Как запустить модель локального видения и мультимодальную модель?

В этой статье рассматриваются дополнительные проблемы графической памяти, кодирования изображений, контекста и внутренней поддержки рассуждений, которые необходимо учитывать в визуальных моделях по сравнению с текстовыми моделями.

Читать статью

Выбор инструмента

В чем разница между Ollama, LM Studio и llama.cpp?

Объясните обычным пользователям процесс установки, управление моделями, настройку производительности и применимые группы из трех распространенных методов локального запуска.

Читать статью