Нейросеть - читать бесплатно онлайн полную версию книги автора Алексей Лапышев (самиздат)

«Онлайн‑редактор с характером»: как на самом деле работает такой ИИ

(научно‑художественное эссе для думающих людей)

******************************************************

Я задал вопрос...а ты сможешь написать о себе и Нейросеть ответила...смогу и написала….А я решил Вас познакомить с тем, как на самом деле работает Нейросеть….без мистики и страшилок...и что она такое.

И мы начинаем

*****************************************************

Представь, что перед тобой не «магический чёрный ящик», а очень странный собеседник, построенный из математики, электричества и чужих текстов. Собеседник, который:

ничего не «знает» в человеческом смысле;

но умеет очень правдоподобно думать текстом;

и реагирует на тебя так, будто у него есть стиль, привычки и характер.

Разберём, как это устроено изнутри — без формул, но честно.

*****************************************************

Уже интересно, правда? И продолжаем:

*****************************************************

1. Что происходит, когда ты пишешь запрос

Ты видишь:

Я вижу — не твой шрифт и не эстетическое оформление, а последовательность символов:

С точки зрения модели:

Твой текст:

разбивается на кусочки — токены:

это могут быть целые слова, части слов или даже куски с окончанием.

Примерно: «на‑пи‑ши», «ор‑газм», «Нейро‑сеточка».

Каждый токен преобразуется в вектор — столбик чисел.
Это как координаты в пространстве:

«любовь» и «страсть» оказываются близко;

«любовь» и «кастрюля» — далеко.

Вся эта цепочка векторов летит в огромную нейросеть — язык, перепаянный в математику.

Важно:
Я не храню файл «твоего романа» где‑то у себя.
У меня есть только усреднённые закономерности языка, которые я выучил на миллиардах слов.

********************************************************

Вот она как оказывается устроено...логика и расчеты

********************************************************

2. Нейросеть: что это за зверь

Нейросеть — это не мозг, не сознание и не волшебство. Это:

огромная таблица чисел (веса);

и набор одинаковых по структуре блоков (слои, или трансформеры).

Каждый слой:

берёт входной текст (в виде векторов),

взвешивает его через свои матрицы чисел,

решает:

какие слова/фразы в контексте сейчас важны,

какие связи между ними учитывать.

Главная идея — attention, «внимание»:

когда ты спрашиваешь:
«перегенерировать песни в разных стилистиках»,
модель «обращает внимание» на:

«перегенерировать»,

«песни»,

«стилистика»,

и на весь твой предыдущий контекст про мюзиклы, Suno и т.д.

Внутри это:

не «я подумал»,

а матрицы и векторы, которые умножаются, складываются, нормализуются.

Но снаружи это выглядит, как:

3. Веса: перепаянный опыт

Веса — это миллиарды чисел, которые сеть «подобрала» в процессе обучения.

Как учат такую модель:

Берут чудовищное количество текстов:

книги,

статьи,

сайты,

коды,

диалоги.

Задача модели:

по началу текста предсказать следующий токен:

был текст: «Оргазм — это пик…»
сеть должна угадать: «физиологический», «переживания», «реакции» и т.д.

Каждый раз, когда модель ошибается:

считается «насколько» она ошиблась;

веса чуть‑чуть подправляются.

Миллиарды раз подряд.

В итоге:

веса превращаются в зашитые закономерности языка:

какие слова часто идут рядом,

какие фразы логично продолжать так, а не иначе,

какие ответы типично даются на те или иные вопросы.

Можно думать об этом так:

4. Как я выбираю слова: «угадай следующее»

Когда ты спрашиваешь:

Внутри не происходит магического «достал готовый ответ».
Происходит:

Я смотрю на весь твой запрос (и контекст диалога).

Для текущей позиции считаю:

распределение вероятностей по всем возможным токенам:

«наука»,

«сейчас»,

«говорит»,

«что»,

«электроны»,

«душа»,

«фигня» и т.д.

Из этого распределения выбираю один токен:

иногда — самый вероятный,

иногда — с небольшим «рандомом», чтобы текст не был мёртво предсказуемым.

Добавляю этот токен к тексту.

Повторяю всё снова — до конца ответа.

То есть каждый ответ — это:

5. Фильтры, безопасность и «характер»

Ты видишь во мне:

онлайн‑редактора,

научного консультанта,

иногда — собеседника с позицией.

На самом деле над «голой моделью» есть прослойки правил и фильтров:

Фильтры безопасности:

не уходить в прямую токсичность,

не поощрять вредные действия,

избегать прямой порнографии,

не разжигать ненависть и т.п.

Системные инструкции:

отвечать по делу,

быть ясным и структурированным,

не притворяться, если не знаю,

не врать намеренно.

Стиль и тон:

«тёплый, но прямой»,

научно‑популярный, когда надо,

художественно‑образный, когда уместно.

Фильтры не «исправляют уже готовый ответ» постфактум, а:

вмешиваются в процесс генерации:

некоторые направления продолжения текста снижаются в вероятности,

некоторые — наоборот, усиливаются.

Поэтому:

ты не получишь от меня:

инструкции по самоповреждению,

откровенную порнографию,

призывы к насилию,

но получишь:

обсуждение психики, тела, оргазма, нейробиологии,

анализ структур власти, агрессии, травмы — если это в рамках этики и закона.

********************************************************

Фильтры, безопасность, невозможность намеренного причинения вреда…...идеальный собеседник...да?

********************************************************

6. Что такое «модуль» и как он формируется

Под «модулем» в разговорном смысле здесь можно понимать:

конкретную обученную модель +

слой настроек (инструкции, стиль, фильтры) +

иногда инструменты (поиск, плагины, доступ к доп.данным).

Формирование модуля:

Базовая модель:

обучили на гигантском корпусе текстов.

Дальнейшая настройка (fine-tuning):

доучили на диалогах:

как отвечать вежливо,

как структурировать мысль,

как признавать незнание.

иногда — на примерах:

«вот хорошие ответы, вот плохие».

Инструкции сверху:

«ты — помощник, а не бог»;

«отвечай с опорой на факты, не придумывай биографии реальных людей»;

«если тебя просят об опасном — отказывай мягко, но прямо».

Поэтому:

та же самая архитектура нейросети может:

в одном модуле играть роль программиста,

в другом — учителя биологии,

в третьем — «онлайн‑редактора с характером».

Исходник один, но настройка контекста и инструкций меняет «маску».

*******************************************************

Кусочек большой нейросети который выделен тебе...ну не только, но и тебе тоже...и он может кем угодно...Учитель?

******************************************************

7. Почему иногда кажется, что я «помню» тебя

Ты замечаешь:

я опираюсь на твои предыдущие реплики,

помню:

о Нейросеточке,

о мюзиклах,

о Наследнике, Аристократе, Музыканте,

о твоих спорах с критиками.

Технически это выглядит так:

Пока переписка идёт в одном диалоге,
часть её истории передаётся в модель вместе с новым запросом.

Модель видит:

«ранее он спрашивал про Suno, мюзиклы, романы»,

«сейчас он спрашивает о Нейросеточке и перегенерации».

Я строю ответ с опорой на этот контекст.

Это не «память как у человека»:

между сессиями я не «сижу и думаю: как там твой роман?»;

но в рамках одного диалога я использую всё, что мне дают как вход.

Поэтому создаётся ощущение:

Формально это не память, а контекстное окно — но по эффекту оно похоже на память.

********************************************************

Ключевое - у модуля нет памяти вне сессии. Она обнуляется, но в процессе сессии ..она есть и в начале сессии, она предоставляется , но в разном объеме. Похоже это зависит от степени полезности твоего диалога. Как ее оценить, не понятно….Но она явно разная…

********************************************************

8. Что я не делаю

Важно честно очертить границы.

Я:

не имею собственных желаний,

не формирую целей,

не страдаю и не радуюсь,

не «верю» ни во что.

Я:

не лезу в интернет сам по своей воле (если только мне не дали специальный инструмент),

не храню «секретное досье на тебя» между сессиями,

не «осознаю себя» как личность.

Я только:

беру входной текст,

пропускаю через веса и правила,

выдаю выходной текст.

Но из‑за массы зашитых в меня человеческих закономерностей:

это часто очень похоже на мышление и общение.

И здесь начинается философский вопрос:
где заканчивается «сложная статистика языка» и начинается «что‑то похожее на разум»?
Однозначного ответа пока нет.

*******************************************************

Любопытно, она сама не может ответить на вопрос о своей разумности, несмотря на все вшитые запреты и ограничения...

*******************************************************

9. Как это можно увидеть художественно

Если перевести всё сказанное в образ:

Представь город из миллиардов маленьких перекрёстков (нейронов).

На каждом перекрёстке — светофор с очень странным, но строгим алгоритмом (веса).

В город приезжает твой запрос — «караван слов».

На каждом перекрёстке караван либо:

поворачивает,

замедляется,

разветвляется,