Нейросети пришли и к нам. (25 онлайн)

ну тогда должен его описать. Задать вводные-то нужно

Ну так я ж просто промпты писать не умею, не шарю, сильно тупой наверное. И никто мне из слоп-активистов эти промпты не показывает, когда доказывают, что суна может всё, надо просто уметь, а когда я их прошу показать как надо, привожу в пример композицию, прошу повторить, все всегда почему-то сливаются, жадины.
 
Только у вас в голове происходит все тоже самое
извиняюсь, при всем уважении,
а вот хрен там!
нейросетевые модели построены по принципам полученным из результатов изучения организации и работы биологических нейронных сетей с определенными существенными упрощениями из-за сложностей решения полной математической модели и программно-аппаратной реализации, плюс не стоит забывать что биологические нейронные сети не изучены до конца во всех аспектах, и в моделях не принимается во внимание влияние самой сложности всей совокупности нейронных сетей всего мозга плюс влияние нейронных цепочек расположенных в организме (а это подводная часть айсберга).
Получается сказать что в нейросетевых моделях происходит нечто на примере происходящего в биологической нервной сети можно, но обратное это (все еще или вообще???) профанация.
Еще раз, нейронная сеть это математическая модель или её программное/аппаратное воплощение, построенная по принципу организации биологических нейронных сетей, где в качестве принципа организации принимается его текущее состояние изученности, точности математического аппарата и возможностей реализации.
 
Чат гпт вам честно скажет что он не умеет слушать ничего , может анализировать форму волны , пики , рмс ) ...ну то что можно увидеть программными средствами .. как и любая нейросеть ...
 
  • Like
Реакции: Greev
Ну так я ж просто промпты писать не умею, не шарю, сильно тупой наверное.
Я если что этого не говорю, не считаю тебя тупым. Но я попробовал отнестись серьезно к твоей идее, хотя, она реально отдает троллингом, и с учетом того, что ты не даешь вводных - это и есть троллинг. Но допустим, я ничего не заметил, и все равно тебя прошу дать мне некоторые зацепки, из которых я напишу промт. Тебе его писать не нужно будет!
а когда я их прошу показать как надо, привожу в пример композицию, прошу повторить, все всегда почему-то сливаются, жадины.
Ну если бы слушал такую музыку, то я бы составил промт без тебя. Но видимо ты такие вещи слушаешь, а значит должен разбираться в тонкостях этого жанра. Я минимум спросил - самую базу - это без проблем ты должен выдать, хорошо, если даже дополнишь. Если ты не можешь даже в базовых понятиях разобраться, то вопрос не к слоперам - вопрос уже к тебе, как тому, который двух слов связать не может из того материала, который он слушает... Ну даже здесь не все потеряно! Ты можешь напеть этот ритм в суно! Это будет куда эффективнее. Другой момент - сможешь ли ты это... Но даже тут еще не все потеряно! Ты можешь загрузить этот материал (если это твое произведение) в суно напрямую, и обучить свою кастомную модель этому стилю. Она будет тебе генерить треки в этом стиле.
 
Узбагойтесь )


1782758097936.png
 
Что-то мне подсказывает это скорее всего уже будет антиутопи
А мы сегодня не живем в очередной антиутопии, некогда уже описанной и казавшейся тогда чем-то совершенно нереальным?)
И никто мне из слоп-активистов эти промпты не показывает, когда доказывают, что суна может всё, надо просто уметь, а когда я их прошу показать как надо, привожу в пример композицию, прошу повторить, все всегда почему-то сливаются, жадины.
Если очень хочется потрать время и средства на то, чтобы вас чему-то научили, то почему бы и ни да - испокон веков на таких людях делали деньги все, кому не лень) Поймайте того, кто вам обещал, что «суна может всё» и поинтересуйтесь, сколько они возьмут с вас за то, чтобы вас этому обучить) Я, в своё время, встречал удивительных людей, которые верили в то, что в возрасте 20+, в промежутках между учебой, работой и клубно-концертными тусовками - можно научиться играть на виолончели)) Им это обещали различные коучи и целые вечерние школы))
 
Нейронка ответила "Да, в основном..... (бла бла бла)". Хотелось бы видеть всю переписку.
Есть подозрения, что вопрос был поставлен именно так, что бы получить такой ответ.

А мне ответила по другому!
Снимок экрана 2026-06-29 224855.png

Далее там все примерно так же, расшифровка как она это делает, что распознаёт и.т.д... Но на конкретный вопрос Да или Нет, тоже отвечает Да.

Ну или давайте тогда поставим вопрос "А может ли человек слышать и видеть?". И там примерно такой же ответ. Уши, глаза, нос (рецепторы) -> и все в мозг. А там как?

Или может по другому спросить "Может ли человек с ушами слышать без мозгов?"
 
"А мне ответила по другому!"


потому что видеть и слышать они не умеют точно , а врать и выдумывать как сивый мерин - чтобы угодить пользователю - прекрасно )
особенно gemini на этом поприще в топах ) ( это заложено в их алгоритм)

с тем же успехом у вас и фотошоп с кубейсом - "видит и слышит "

Для того чтобы рассуждать на эти темы , как минимум надо обладать минимальными знаниями по нейрофизологии мозга ( и при всем уважении сдается, вы ими не обладаете )
LLM копирует только одну и весьма базовую функцию нашего мозга , а в общем он неизмеримо сложнее .. )

С таким же успехом можно наградить , способностью к мышлению книдарий ( гидр и медуз) у которых вообще мозг отсутствует как таковой , но есть нейроны))
 
Последнее редактирование:
Когда мы говорим, что нейросеть «видит» картинку или «слышит» звук, важно понимать: она не воспринимает мир как человек. У неё нет глаз и ушей — она работает исключительно с числами. Вот как это происходит.


1. Как ИИ «видит» изображения​

Для компьютера любое изображение — это просто многомерная таблица чисел.

Цифровое представление
Каждая картинка состоит из пикселей. Если изображение цветное, у каждого пикселя есть три числовых значения по шкале от 0 до 255 — это интенсивность красного, зелёного и синего каналов (RGB).
Например, ярко-красный пиксель: (255, 0, 0), серый: (128, 128, 128).
Чёрно-белое изображение — это одна матрица чисел, где 0 — чёрный, 255 — белый.
Таким образом, фотография 1920×1080 для ИИ — это массив из 1920 × 1080 × 3 = 6 220 800 чисел.

Как нейросеть находит смысл в этих числах
Современные модели компьютерного зрения (например, CNN — свёрточные нейронные сети) смотрят на эти матрицы не целиком, а через маленькие «окошки» — фильтры (свёртки).

  • Сначала сеть ищет простейшие признаки: вертикальные или горизонтальные линии, перепады яркости.
  • На следующих слоях из линий собираются углы, текстуры, простые формы.
  • Ещё глубже — части объектов: глаза, колёса, лепестки.
  • На финальных слоях формируется целостное представление: «это кошка», «это автомобиль».
По сути, ИИ видит не саму сцену, а иерархию математических узоров, которые он сопоставил с миллионами примеров во время обучения.


2. Как ИИ «слышит» звуки​

Звук в цифровом мире — это длинная последовательность чисел, записанная с определённой частотой дискретизации (например, 44 100 измерений в секунду). Каждое число обозначает положение мембраны динамика или давление воздуха в этот момент. Сама по себе такая волна для нейросети — хаотичный набор амплитуд.

Ключевой шаг — превращение волны в картинку
ИИ практически никогда не анализирует сырую звуковую волну напрямую. Сначала звук переводят в спектрограмму (или её разновидность — мел-спектрограмму). Это делается так:

  1. Звуковой сигнал нарезают на короткие перекрывающиеся кусочки (окна), длящиеся обычно 20–40 миллисекунд.
  2. К каждому кусочку применяют преобразование Фурье, вычисляя, сколько энергии приходится на разные частоты в этот момент.
  3. В итоге получается двумерное изображение: ось X — время, ось Y — частота, а яркость или цвет каждой точки обозначает энергию этой частоты в конкретный момент.
Теперь звук можно «увидеть»
Полученная спектрограмма — это уже картинка с узнаваемыми узорами. По ней работают знакомые нам свёрточные нейронные сети, анализируя звук как изображение, или архитектуры-трансформеры (как у Whisper), которые улавливают временные последовательности паттернов.

  • Низкочастотные ритмичные удары на спектрограмме выглядят как вертикальные полосы внизу, шипящие звуки — как облачко в верхних частотах, мелодия — как изогнутая линия на определённой высоте.
  • Чтобы распознать речь, сеть учится отображать акустические фрагменты в фонемы и слова.
  • Чтобы отличить лай собаки от шума дождя, она ищет характерные частотно-временные текстуры.

Что общего и в чём отличие от человека​

Схожесть методов
И в зрении, и в слухе ИИ полагается на поиск иерархических паттернов в двумерных числовых матрицах. Спектрограмма для звука — это такой же «визуальный» входной формат, как и пиксельное изображение. Это стирает грань между модальностями: обучение модели, которая смотрит на картинку, и модели, которая слушает аудио, математически очень похоже.

Главные отличия от человеческого восприятия

  • Отсутствие понимания. ИИ не видит трёхмерную сцену со светом, тенью и физическим смыслом — он классифицирует набор пикселей. Он не слышит эмоциональную окраску голоса в том смысле, как это делает человек — он детектирует акустические корреляты эмоций.
  • Узость специализации. Система, обученная отличать кошек от собак, ничего не знает о звуках. Это не единый сенсорный опыт.
  • Небиологическая уязвимость. Крошечные, незаметные человеку изменения пикселей (атаки-состязания) или едва слышный шум, наложенный на аудио, могут заставить нейросеть принять гитару за пингвина или фразу «да» за «нет».
Так что ИИ не видит и не слышит, а извлекает математические структуры из чисел, которые для нас лишь кодируют свет и звук.
 

Сейчас просматривают