Руководство по видеопамяти
Какие локальные большие модели можно запускать с разной графической памятью?
От 6 ГБ, 8 ГБ, 12 ГБ, 24 ГБ до 48 ГБ объясните, как объем параметров модели, квантованная версия, кэш KV и системные издержки объединяются, чтобы определить, можно ли его загрузить.
Читать статью
Apple чип
Как Apple Unified Memory влияет на локальный LLM?
Объясните, почему всю память Mac нельзя использовать в качестве видеопамяти и как выбрать подходящую модель для компьютеров с памятью 16 ГБ, 32 ГБ, 64 ГБ и 128 ГБ.
Читать статью
Количественная оценка
Q4, Q5, Q6, Q8 Как мне выбрать количественную оценку?
Более распространенная количественная оценка GGUF использования памяти, потери качества и компромисса в скорости помогает пользователям понять три предпочтения: приоритет качества, баланс и длинный контекст.
Читать статью
модель программирования
Как выбрать местную LLM, подходящую для программирования?
Используя четыре сценария генерации кода, интерпретации, реконструкции и длинного контекста, объясните, почему в целях программирования нельзя просто учитывать размер модели и объем загрузки.
Читать статью
мультимодальный
Как запустить модель локального видения и мультимодальную модель?
В этой статье рассматриваются дополнительные проблемы графической памяти, кодирования изображений, контекста и внутренней поддержки рассуждений, которые необходимо учитывать в визуальных моделях по сравнению с текстовыми моделями.
Читать статью
Выбор инструмента
В чем разница между Ollama, LM Studio и llama.cpp?
Объясните обычным пользователям процесс установки, управление моделями, настройку производительности и применимые группы из трех распространенных методов локального запуска.
Читать статью