Нейросети

Поделиться612024-04-02 03:46:39

Автор: nomiren472
6 категория
Зарегистрирован: 2023-10-09
Приглашений: 0
Сообщений: 91
Уважение: +10
Позитив: +10
Провел на форуме:
1 день 0 часов
Последний визит:
2025-10-12 23:34:47

поставил себе винду 10 поигрался с ней в общем пришел к выводу что lowvram параметр использовать совсем нельзя
надо без него и надо смотреть подбирать число слоев на видяхе и вне ее
когда удачное число слоев что на нагрузке цпу и гпу получается такая расческа из нагрузки и хорошо молотит
при этом если дать буквально на 1-2 слоя больше сильно проваливается скорость внизразница может быть увроня 8-9 токенов против 2-3 токена в секунду!
проверяйте и подбирайте под себя число слоев

две новые умные модели из топов
https://huggingface.co/models?search=Starling-LM-7B-beta gguf - эта в топе
https://huggingface.co/mradermacher/Mis … ences=true - это совсем свежий микс на базе предыдущей пока не в топе

0

Поделиться622024-04-02 14:37:32

Автор: Slilo
5 категория
Зарегистрирован: 2018-08-28
Приглашений: 0
Сообщений: 106
Уважение: +8
Позитив: +54
Провел на форуме:
1 день 16 часов
Последний визит:
2025-10-20 10:30:08

Вот подвезли первую игру с нейронкой внутри (по сути тот же чат, но для тех кто не осилил сам поднять кобольда):
https://f95zone.to/threads/gaisha-alpha … ha.202203/

0

Поделиться632024-04-02 22:52:56

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

nomiren472 написал(а):

поставил себе винду 10 поигрался с ней в общем пришел к выводу что lowvram параметр использовать совсем нельзя

Это совершенно не так. В общем случае режим "normal" (по умолчанию, если lowvram не ставишь) нужно использовать только в том случае, если модель полностью влазит в видеопамять. Там есть нюансы, типа если совсем немного не хватает, то можно - но в целом lowvram это совершенно другой режим, заточенный под совместную работу процессора и ГПУ. Процессор только нужен нормальный. Вот 12400 - это нормальный

0

Поделиться642024-04-02 22:58:53

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Я кстати интересную карточку нашёл:
https://chub.ai/characters/SpringyTwist/text-adventure

Попробуйте её с какой-нибудь хорошей RP-шной моделью.

Кстати Silly Tavern с того времени, когда я её раньше использовал, очень сильно продвинулась вперёд. Там даже есть теперь переводчик в обе стороны - то есть ты пишешь модели на русском, она получает запрос на английском, отвечает тебе на английском - а ты получаешь ответ на русском Не без косяков, но играть можно. Разобраться бы ещё в огромном количестве функций этой таверны...

0

Поделиться652024-04-03 19:09:59

Автор: nomiren472
6 категория
Зарегистрирован: 2023-10-09
Приглашений: 0
Сообщений: 91
Уважение: +10
Позитив: +10
Провел на форуме:
1 день 0 часов
Последний визит:
2025-10-12 23:34:47

Vlad100 написал(а):

nomiren472 написал(а):

поставил себе винду 10 поигрался с ней в общем пришел к выводу что lowvram параметр использовать совсем нельзя

Это совершенно не так. В общем случае режим "normal" (по умолчанию, если lowvram не ставишь) нужно использовать только в том случае, если модель полностью влазит в видеопамять. Там есть нюансы, типа если совсем немного не хватает, то можно - но в целом lowvram это совершенно другой режим, заточенный под совместную работу процессора и ГПУ. Процессор только нужен нормальный. Вот 12400 - это нормальный

у меня с ним скорость всегда низкая! разница 2-3х
а без него на пару слоев меньше влезет но зато гораздо быстрее
надо смотреть и подбирать под себя(под железо и ось)
на одном и том же железе на 11 и на 10 винде разное число слоев влазит и скорость разная

0

Поделиться662024-04-14 22:19:24

Автор: nomiren472
6 категория
Зарегистрирован: 2023-10-09
Приглашений: 0
Сообщений: 91
Уважение: +10
Позитив: +10
Провел на форуме:
1 день 0 часов
Последний визит:
2025-10-12 23:34:47

Две топ модели на сегодня 35Б параметров
Command-R (не + а обычная версия) и Qwen

Если кто знает топ модели на 20Б+ параметров пишите - кроме luxia ни одной не знаю

0

Поделиться672024-04-15 06:33:55

Автор: DX2
7 категория
Зарегистрирован: 2021-02-01
Приглашений: 0
Сообщений: 27
Уважение: +3
Позитив: +6
Провел на форуме:
11 часов 52 минуты
Последний визит:
Сегодня 06:20:47

Ребята, подскажите, есть ли нейросетка превращающая рисунок в фото (фотореалистичный рисунок)? Мультяшную сцену в реальную.

0

Поделиться682024-04-15 21:31:25

Автор: jm
Нубус
Зарегистрирован: 2024-01-16
Приглашений: 0
Сообщений: 2
Уважение: 0
Позитив: 0
Провел на форуме:
17 часов 32 минуты
Последний визит:
2025-05-02 14:56:41

nomiren472 написал(а):

Две топ модели на сегодня 35Б параметров
Command-R (не + а обычная версия) и Qwen

Если кто знает топ модели на 20Б+ параметров пишите - кроме luxia ни одной не знаю

Попробуйте Lewd-Sydney-20B. Меня она приятно удивила после InfinityRP-v1-7B. Насчет "топ" не уверен конечно.

0

Поделиться692024-04-16 00:52:55

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Вышел WizardLM-2. Пощупать 7B можно здесь:
https://huggingface.co/bartowski/WizardLM-2-7B-GGUF

Модель нового поколения, пока без тюнинга и с цензурой, но любопытно.

0

Поделиться702024-04-16 16:42:55

Автор: Slilo
5 категория
Зарегистрирован: 2018-08-28
Приглашений: 0
Сообщений: 106
Уважение: +8
Позитив: +54
Провел на форуме:
1 день 16 часов
Последний визит:
2025-10-20 10:30:08

DX2
да в целом любая современная по обработке изображений. Дальше "всего лишь" нужно разобраться как подключить к ней LoRa и другие плагины чтобы загрузить базу, а затем выдать правильный ПРОМТ. Какая именно лучше всего подойдет я не знаю. У меня слишом слабое железо чтобы играться с такими штуками, а онлайн графика чет дорого стоит :-)

0

Поделиться712024-04-18 21:59:29

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Третья Ллама вышла. Может в русский. Пока 8B доступна в Угабуге, но скоро добавят и в лламаспп и соответственно в Кобольд. А там и версия 70В подоспеет - очень ждём В смысле её уже выложили, но там работы больше.

0

Поделиться722024-04-20 22:45:34

Автор: jm
Нубус
Зарегистрирован: 2024-01-16
Приглашений: 0
Сообщений: 2
Уважение: 0
Позитив: 0
Провел на форуме:
17 часов 32 минуты
Последний визит:
2025-05-02 14:56:41

Vlad100 написал(а):

Третья Ллама вышла. Может в русский. Пока 8B доступна в Угабуге, но скоро добавят и в лламаспп и соответственно в Кобольд. А там и версия 70В подоспеет - очень ждём В смысле её уже выложили, но там работы больше.

~~Poppy_Porpoise-v0.2-L3-8B-GGUF-IQ-Imatrix~~
Рабочий вариант.

Aura_Uncensored_l3_8B-GGUF-IQ-Imatrix

Отредактировано jm (2024-04-21 08:14:40)

0

Поделиться732024-06-15 05:27:36

Автор: Илона
7 категория
Зарегистрирован: 2023-08-17
Приглашений: 0
Сообщений: 26
Уважение: +2
Позитив: +1
Провел на форуме:
6 часов 59 минут
Последний визит:
2025-02-11 23:23:58

Vlad100 написал(а):

Это совершенно не так. В общем случае режим "normal" (по умолчанию, если lowvram не ставишь) нужно использовать только в том случае, если модель полностью влазит в видеопамять. Там есть нюансы, типа если совсем немного не хватает, то можно - но в целом lowvram это совершенно другой режим, заточенный под совместную работу процессора и ГПУ. Процессор только нужен нормальный. Вот 12400 - это нормальный

Привет дай пожалуйста ссылки на норм русскую модель. А то данные тобой ранее битые уже

0

Поделиться742024-06-15 08:17:54

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Илона написал(а):

Привет дай пожалуйста ссылки на норм русскую модель. А то данные тобой ранее битые уже

Говорят, что aya-23 8B ничего:
https://huggingface.co/bartowski/aya-23-8B-GGUF

И Llama3 8B вроде может, искать на huggingface.co по запросу "Llama3 8B gguf", там уже довольно много модификаций, которые может уже и плохо умеют в русский, но чистая модель должна уметь. Лично я давно забил и пользуюсь встроенным в Silly Tavern переводчиком, хоть он и далёк от совершенства. Но дело в том, что текст, генерируемый моделями тоже далёк от совершенства, поэтому модель 1) Неплохо его воспринимает и 2) Ответ в переводе достаточно адекватен.

0

Поделиться752024-06-15 08:39:26

Автор: Илона
7 категория
Зарегистрирован: 2023-08-17
Приглашений: 0
Сообщений: 26
Уважение: +2
Позитив: +1
Провел на форуме:
6 часов 59 минут
Последний визит:
2025-02-11 23:23:58

Vlad100 написал(а):

Говорят, что aya-23 8B ничего:
https://huggingface.co/bartowski/aya-23-8B-GGUF

И Llama3 8B вроде может, искать на huggingface.co по запросу "Llama3 8B gguf", там уже довольно много модификаций, которые может уже и плохо умеют в русский, но чистая модель должна уметь. Лично я давно забил и пользуюсь встроенным в Silly Tavern переводчиком, хоть он и далёк от совершенства. Но дело в том, что текст, генерируемый моделями тоже далёк от совершенства, поэтому модель 1) Неплохо его воспринимает и 2) Ответ в переводе достаточно адекватен.

А уставливать так же, как ты в первом своем посте с бат-файлом советовал? Прописывать в бат-файл что?

0

Поделиться762024-06-15 17:27:06

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Илона написал(а):

А уставливать так же, как ты в первом своем посте с бат-файлом советовал? Прописывать в бат-файл что?

От видеокарты зависит. Например для видеокарты с 8Гб видеопамяти примерно так:
koboldcpp.exe --usecublas lowvram --contextsize 8192 --blasbatchsize 512 --gpulayers 19 --flashattention --threads 8 --highpriority --model Имя_модели_нейросети.gguf

Дальше нажимаешь Ctlr+Shift+Esc, открываешь Диспетчер задач и во вкладке "Производительность-Графический процессор" смотришь потребление видеопамяти. Она должна быть загружена не более чем на 90%, если больше - закрываешь Кобольд и правишь батник, а именно уменьшаешь количество слоёв, выгружаемых на видеокарту (параметр gpulayers). Ну и наоборот, если видеопамять недогружена.

Отредактировано Vlad100 (2024-06-15 17:27:53)

0

Поделиться772024-07-22 00:40:32

Автор: nomiren472
6 категория
Зарегистрирован: 2023-10-09
Приглашений: 0
Сообщений: 91
Уважение: +10
Позитив: +10
Провел на форуме:
1 день 0 часов
Последний визит:
2025-10-12 23:34:47

этот клиент позволяет сэкономить память на кеше https://github.com/Nexesenex/kobold.cpp/releases
пример
--flashattention --quantkv 18

особенно актуально для aya/command-r

берите свежие модели мистрал / гемма 9-12B

0

Поделиться782024-07-24 22:00:20

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

Вышла Mistral Large 2 123B. Это событие, которого уже давно ждали. Miqu 70b (первая Mistral Large) была хороша, вот только исправить/добавить в неё ничего было нельзя. А новая версия, как говорят, не уступает большой Лламе 3.1 405В, которая при таких размерах особо никому не нужна. Теперь ждём файнтюнов, децензоров и всего такого.

0

Поделиться792024-07-24 22:04:15

Автор: Vlad100
5 категория
Зарегистрирован: 2017-11-04
Приглашений: 0
Сообщений: 162
Уважение: +39
Позитив: +3
Провел на форуме:
4 дня 8 часов
Последний визит:
2025-10-13 12:03:45

nomiren472 написал(а):

--quantkv 18

Из хелпа: --quantkv [quantization level 0/1/2], где 0 - 16-битный кэш, оригинальный, 1 - 8-битный кэш и 2 - 4-битный кэш. Выигрыш к сожалению только в занимаемой кэшем памяти, скорость обработки остаётся прежней. Ну и с качеством могут быть проблемы. Плюс при использовании quantkv перестаёт работать context shift.

Отредактировано Vlad100 (2024-07-24 22:05:07)

0

Поделиться802024-07-27 22:22:48

Автор: orlangur
6 категория
Зарегистрирован: 2022-05-23
Приглашений: 0
Сообщений: 56
Уважение: +11
Позитив: +23
Провел на форуме:
1 день 0 часов
Последний визит:
2025-08-15 00:06:35

Vlad100 написал(а):

Может в русский

Вроде вторая уже норм была. Пробовал украинский с nous-hermes:13b-llama2, все норм, только матюки не очень знает, в сгенерированном порно-рассказике выдавало перлы вроде «поставил на колени и поцеловал на рот».

0

Кружок любителей игр

Меню навигации

Пользовательские ссылки

Объявление

Информация о пользователе

Нейросети

Сообщений 61 страница 80 из 127

Поделиться612024-04-02 03:46:39

Поделиться622024-04-02 14:37:32

Поделиться632024-04-02 22:52:56

Поделиться642024-04-02 22:58:53

Поделиться652024-04-03 19:09:59

Поделиться662024-04-14 22:19:24

Поделиться672024-04-15 06:33:55

Поделиться682024-04-15 21:31:25

Поделиться692024-04-16 00:52:55

Поделиться702024-04-16 16:42:55

Поделиться712024-04-18 21:59:29

Поделиться722024-04-20 22:45:34

Поделиться732024-06-15 05:27:36

Поделиться742024-06-15 08:17:54

Поделиться752024-06-15 08:39:26

Поделиться762024-06-15 17:27:06

Поделиться772024-07-22 00:40:32

Поделиться782024-07-24 22:00:20

Поделиться792024-07-24 22:04:15

Поделиться802024-07-27 22:22:48