powered by simpleCommunicator - 2.0.18     © 2024 Programmizd 02
Map
Форумы / Просто Трёп [закрыт для гостей] / Вчера гуглил, как люди распознают аудтотреки или голос
14 сообщений из 14, страница 1 из 1
Вчера гуглил, как люди распознают аудтотреки или голос
    #684330
lour
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
весь фокус - в получении сонограммы/спектрограммы из трека
далее она превращается в нули и единицы (первые 20 сек) (в стандартный формат для нейросети [input, output]) и скармливается нейросетке в БД обучения

после накопления ума, нейросеть уже может отдавать результаты
многое зависит от числа хидден-лэйерз

другими словами, нейросеть не распознает голос или трек, если его нет в БД сети
она выдаст результат, максимально приближённый к запросу, но не более

в принципе - всё

для получения спектрограмм есть готовые библы, написанные умными кодерами, хотя можно и самому, попроще

главный минус всех NN - долгий процесс загрузки шаблона обучений и все это требует ресурсов ЦPU
ну и соотв. - трудозатраты на сам процесс обучения
ручной тяглый труд

касательно музаудиотреков, там можно сильно упростить обучение - тренировать сеть только на файлах, в которых прописаны метаданные - стиль, название и прочее

оказывается, в инете уже есть сайты, предоставляющие свои платные API, для распознавания аудио
и на гитхабе - тьма врапперов, под такие "апи" [:biggrin2]

------------------------------

главный вопрос - а, зачем?
- хуйзнает
...
Изменено: 01.01.2024, 16:40 - lour
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #684363
lour
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Картинка
...
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685211
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
а, да, вспомнил про распознавалки разных контор: когда вы хотя бы раз туда звонили и говорили своим голосом (даже - боту), спектрограмма вашего "я" там уже, есть

в следующий раз, даже, если вы будете звонить им из зимбабве, распознавалка мгновенно вас вычислит (по спектру вашего голоса) ))

- это, еще один из примеров применения подобной хуйни ))
...
Рейтинг: 1 / 0
Нравится: 1_(webForums fanat)
Вчера гуглил, как люди распознают аудтотреки или голос
    #685213
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
вот еще интересная инфа: по сути получается, что на основе нейросети, распознающей голос, можно реализовать уникальную идентификацию личности

для чего?
ну, например, для оплаты ТНП ))

у москалей же в метро уже делали распознавалку по ебальнику ))
года 3 назад, видос мелькал на ютубах
...
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685215
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
далее сразу возникает тема фейков ))
тоесть - можно ли реализовать некий генератор шума, спектр которого будет имитировать любого? )))

например - есть же т.н. хеш-коллизии
так и это
...
Изменено: 02.01.2024, 02:23 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685221
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
вот еще тема возникла, одна...

интересно, как меняется спектр речи в зависимости от возраста?
тоесть, понятно, что - меняется
вопрос - в другом:

можно ли провести идентификацию одного и того же человека по голосу с разницей в 5-10-30 лет?

если, да - то это весьма интересная, тема...
например можно сравнить голоса известной политоты ))
а то тут разное про них говорят ))))
...
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685223
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
и если ебало можно рихтануть (проведением ряда пластоперций)
то, можно ли таким же образом рихтануть спектр голоса? )
...
Изменено: 02.01.2024, 02:29 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685226
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
в принципе, можно уже сейчас самостоятельно провести ряд исследований в этой области:

например, найти несколько известных личностей, которые ни у кого не вызывают сомнения в их подлинности и провести анализ их речевых спектров на протяжении их жизни
...
Изменено: 02.01.2024, 02:32 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685227
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
что ещё, можно?

например мгновенно диагностировать неисправность автомобиля по шуму, который он издаёт ))
но для этого потребуется создать специальную БД для обучения нейросети (ну, как и везде)

хотя, электрику авто, так вряд ли вычислишь
да и есть уже суперские диагностические комплексы, кмк
хуйня это всё
...
Изменено: 02.01.2024, 02:36 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685228
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
что еще?

- например, диагностировать спектр заболеваний человека по спектру его дыхания ))
наверное, это кажется, бредом, но, мало ли... ))

вопрос - в создании шаблонов для обучения нейросети
...
Изменено: 02.01.2024, 02:35 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685230
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
еще с помощью нейросети можно предсказывать землетрясения
хотя, такое давно уже есть и без нейрос
...
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685233
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
еще можно попросить юзера форума сказануть что либо в микрофон )
из этого звука получить спектрограмму и в дальнейшем проводить идентификацию при утере пароля, потере кукисов и тд

можно даже написать такой простенький класс для теста желающих ))
...
Изменено: 02.01.2024, 02:45 - тоу
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #685943
1_(webForums fanat)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Пожалуй, самое полезное применение речевых распознавалок : стенограмма популярных телепередач (новости, ток-шоу, ...) с последующим всенародным обсуждением в формате вебфорума. Ох, как власти боятся такой перспективы... )

Помню, пару лет назад телекомпания ОТР ещё публиковала текстовые конспекты своих ток-шоу, но обсуждать это в формате ВКонтактика? - чёрт ногу сломит..., да и конфиденциальности нет :(. А других известных форумов модерируемых но без лишней цензуры -- мне не известно.
Помечтаем?
В общем, телекомпаниям нужен быстрый текстовый сайт-форум. Возможно, даже договорятся о единой площадке.

Представьте, как это будет: В момент выхода телепередачи -- вся страна включает компьютеры. Потому что самое интересное -- именно в текстовых комменетах.
...
Изменено: 02.01.2024, 15:13 - 1_(webForums fanat)
Рейтинг: 0 / 0
Вчера гуглил, как люди распознают аудтотреки или голос
    #686339
тоу
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
1_(webForums fanat)  02.01.2024, 15:11
[игнорируется]
Пожалуй, самое полезное применение речевых распознавалок : стенограмма популярных телепередач (новости, ток-шоу, ...) с последующим всенародным обсуждением в формате вебфорума. Ох, как власти боятся такой перспективы... )

Помню, пару лет назад телекомпания ОТР ещё публиковала текстовые конспекты своих ток-шоу, но обсуждать это в формате ВКонтактика? - чёрт ногу сломит..., да и конфиденциальности нет :(. А других известных форумов модерируемых но без лишней цензуры -- мне не известно.
Помечтаем?
В общем, телекомпаниям нужен быстрый текстовый сайт-форум. Возможно, даже договорятся о единой площадке.

Представьте, как это будет: В момент выхода телепередачи -- вся страна включает компьютеры. Потому что самое интересное -- именно в текстовых комменетах.
это не то, не о том распознавании
я писал о нейросети, а ты - о трансформации голоса - в текст

в чём разница:

нейроесть распознаёт голос для последующей идентификации
а просто распознавалки голос-текст такого не умеют и предназначны для другого

ещё раз: распознавание голоса нейросетью предназначено для идентификации персоны, а не для трансформации голоса в текст

проще говоря, нейросеть распознает "кто именно говорит", а не что - именно :)

------------------

а распознавание аудиотреков - да, там распознаётся, что за песенка, потому что в БД н.с. её спектрограмма уже, есть
...
Изменено: 02.01.2024, 18:31 - тоу
Рейтинг: 1 / 0
Нравится: 1_(webForums fanat)
14 сообщений из 14, страница 1 из 1
Форумы / Просто Трёп [закрыт для гостей] / Вчера гуглил, как люди распознают аудтотреки или голос
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (1): Анонимы (1)
Игнорируют тему (1): ZаЛупина
Читали форум (76): Анонимы (75), паразит 9 мин.
Пользователи онлайн (117): Анонимы (114), Yandex Bot, Bing Bot 1 мин., паразит 9 мин.
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]