Документ взят из кэша поисковой машины. Адрес оригинального документа : http://grace.msu.ru/forum/lofiversion/index.php/lofiversion/t1876.html
Дата изменения: Unknown
Дата индексирования: Tue Oct 2 02:00:48 2012
Кодировка: Windows-1251
Грация-МГУ::Форум > А бывает ли такой софт?
Помощь - Поиск - Пользователи - Календарь
Полная версия: А бывает ли такой софт?
Грация-МГУ::Форум > Мультимедия > Аудио
Страницы: 1, 2
czaerlag
Типа метронометр?
Чтобы я ему скармливал mp3-шку, а он мне выделял из нее основную пульсацию и выдавал, сколько в ней bpm? Ежели кто знает, поделитесь ссылочкой, а?
O'Rey
Щас вот вылезет Буривух и скажет, что wavelab скорее всего умеет.

А пока он не вылез, озвучу ключевые слова для гугления: bpm detector
czaerlag
Цитата(O'Rey @ May 5 2008, 13:20) *

А пока он не вылез, озвучу ключевые слова для гугления

Белый человек великий волшебник!
Единственное слово, какое НЕ пришло мне в голову, -- это "detector" ))

Upd: Хотя толку-то чуть. Нашелся один единственный приклад, и работает он так, что лучше бы вообще не работал )
Burivuh
Цитата(O'Rey @ May 5 2008, 13:20) *

Щас вот вылезет Буривух и скажет, что wavelab скорее всего умеет.


Не вылезет.
Он полетел по пути наименьшего сопротивления - сидит тупо тычет кнопку раз в такт. Несовременно, зато надежно.

Для винампа был плагин, однако сей безбожно врал, вследствие чего был с возмущением стерт.
Старый сисадмин
А ну, учоные, даешь преобразование Фурье!
barsik
а чо там преобразовывать?? ai.gif там и так все по частотам разложенное bw.gif изначально
O'Rey
Ох щас и начнется..
Reaper
Превентивный удар:
popcorn.gif
AlexeY
м.б. воспользоваться Вейвлетами?...
O'Rey
popcorn.gif
barsik
Цитата(O'Rey @ May 5 2008, 22:13) *

Ох щас и начнется..

не начнеццо ag.gif похоже, никто тут, кроме тебя и Сиса, не разбирается в форматах, а Сису я, надеюсь, дороже, чем давно умерший Платон ae.gif

Высокая степень компактности MP3 по сравнению с другими форматами, в частности с PCM (т.е. обычный WAV - файл) и ему подобными форматами при сохранении аналогичного качества звучания (рассматривается 16Bit Stereo 44.1kHz) достигается с помощью дополнительного квантования по определенной схеме, которая позволяет минимизировать потери качества. Это достигается учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом предыдущего фрейма, вызывающего временное понижение чувствительности уха к сигналу текущего фрейма (попросту, удаляются второстепенные звуки, которые не слышатся человеческим ухом из-за наличия в данный/предыдущий момент другого - более громкого). Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.

Это называется адаптивным кодированием и позволяет экономить на наименее значимых с точки зрения восприятия человеком деталях звучания. Степень сжатия (а, следовательно, и качество), определяются не форматом, а шириной потока данных при кодировании в MP3...


т.е., резюмирую, никаких ПОДМЕН по частотам тут нету (а разные моды сложить разве можно?), просто какая-то частота удаляется (в течение фрейма), и все. зачем тут Фурье-преобразование-то?? м.б. я чего-то не понимаю, каэшн... bw.gif
O'Rey
Вот щас точно начнется.
Reaper
popcorn.gif popcorn.gif
*Высылаю 2 кота-попкорна для сдерживания мочилова* ag.gif
Старый сисадмин
Все на защиту Фурье!!!
NeProff
Сицилианская оборона!
Honky
Лошадью ходи, век воли не видать! bm.gif
хачапури
Цитата(Honky @ May 6 2008, 17:54) *

Лошадью ходи, век воли не видать! bm.gif


Что-то никто не хочет быть лошадью, с которой покончит barsik. Ладно, давайте я спрошу. Я в этом деле полный профан. bq.gif az.gif

Во-первых, не очень понял, зачем barsik дала обширную ссылку про способ сжатия в MP3 - очень познавательно, но вроде это не помогает ухватить Фурье за хвост? Фурье бы наверное появился бы, если бы мы говорили о сложении звуков / наложении частот / оцифровку ну или чего-то там.

Но даже если мы развезем длиннейшие выдержки про оцифровку сигналов и прочую интересность, мне непонятно, как это приближает нас к ответу на изначальный вопрос, который, afaiu, сводится к следующему: (а) можно ли формальными методами выявлять начало каждого такта в мелодии, (б) существует ли софт, реализующий это дело.

Ммм ?

ЗЫ Кстати, если мы находим точки начала двух последовательных тактов, означает ли это, что задача "а" решена? (если мы знаем время между этими тактами)
AlexeY
а... вообще-то не ясно априори, почему это для распознования следует использовать именно исходное (как есть) разложение в формате?... мммм?.... это 1.

п.2 про реализацию,. как я заметил во многих мелодиях есть вступительная часть, в которых нередко выбивается несколько раз ритм

п.3. по поводу существования формальных методов -- нет ничего невозможного.... уже речь косо-криво умеют распознавать и голос тоже... конечно, для начала (если кто-то захочет это реализовывать), надо будет создать библиотеку "типичных ударов" .. т.е. тактов.. и т.д. и т.п. --- это то, как я бы начал действовать... а далее делается разложение -- не суть важно что.. и ищутся повторения (не обязательно точные)

п.4 если кто-то все-таки реализует такое (или найдет реализованное).. интересно будет погонять такое на ускоряющихся мелодиях.. и мелодиях с нечеткими ритмами.. ah.gif

п.5 думаю, я теперь тоже посижу и по popcorn.gif
barsik
barsik именно и дала ОБШИРНУЮ ссылку на формат mp3 потому, что фурье никакого отношения к этому формату не имеет (а обсуждали именно этот формат). нет там "сложения" частот, нет и вопроса. собсно я об этом и написала, разве нет? bn.gif

чтоб существенно сократить препирательства по дальнейшему углублению рассмотрения, я задам тока 1 вопрос:
ЧТО конкретно вы собирались раскладывать в ряд? вот эту замечательную "зашумленную" кривую, которую показывает эквалайзер (или как его там?) в аудиоредакторах? или?
AlexeY
возвращаясь к моему пункту 1.

Есть разложение ОДИН (заданное форматом) по функциям F_i(t):
f(t)=\sum_{i=0}^{N}(a_i*F_i(t))

КТО МНЕ МЕШАЕТ разложить ТО же по другому набору функций G_j(t)?!
Вот так: f(t)=\sum_{j=0}^{M}(b_j*G_j(t))

поэтому и говорю про Вейвлеты.. ибо, кажется, говоря о частотах, подразумевается один из способов разложения в ряд Фурье по косинусам/синусам.
Но кто мешает раскладывать в ряд Фурье по каким-нибудь другим функциям (базисам) / Фреймам.. Вейвлетам (пусть даже с потерей чего-то.. т.к. возможно, они не образую полную систему)?

===================================
про вопрос О том, что раскладывать.. как что?.. естественно сигнал... ведь формат -- некоторый способ задания сигнала.. говоря о разложении по частотам -- значит, заданы коэффициенты a_i --- по ним при чтении файла восстанавливается сигнал f(t) -- функция времни (в общем случае вектор-функция)... далее ее (сиганал) могу раскладывать как мне будет угодно, если это принесет мне пользу. Вот.
Honky
Картинку с "криком" вставлять не стал, видимо зря. bm.gif
popcorn.gif
O'Rey
Ну вот, началось.
А я предупреждал.
barsik
2Й: тебе давно пора сменить аватар - с жЫзнерадостного желтого дядьки на Зеленого ae.gif ae.gif
хачапури
Цитата(AlexeY @ May 6 2008, 23:33) *
...КТО МНЕ МЕШАЕТ разложить ... далее ее (сиганал) могу раскладывать как мне будет угодно, если это принесет мне пользу. Вот.

Ну, думаю никто не будет тебе мешать раскладывать загадочную "сиганал". Более того, едва ли кто-то сомневается, что ты это сможешь. ag.gif Вопрос-то был в другом - зачем?! Как это поможет найти точки начала тактов?
Старый сисадмин
А зачем нам точки? Нам длительность надо. Ритм, ага
хачапури
Ага. Длительность. Отрезок, типа. А у отрезка есть точки. Начальная и конечная. Причем конечная совпадает с начальной точкой следующего отрезка.

Мне всегда нравилось слово "эквифинальность" :)))
O'Rey
Цитата
Мне всегда нравилось слово "эквифинальность" :)))


А мне - "монопенисуальность".
barsik
баньте уже Йурега за неформат общения ap.gif
хачапури
Цитата(O'Rey @ May 7 2008, 13:31) *

А мне - "монопенисуальность".


О, что ж ты раньше молчал!

Навскидку - темы для развития :

1. Монопенисуальность и длина/конечная точка отрезка;
2. Монопенисуальность и определение ритма мелодии;
3. Моно-, мультипенисуальность и эквифинальность.
Reaper
Так вот кто мою траву спер.
NeProff
Бью конем!!!! Барсик - антимонопенисуальна

а вообще если по делу то есть у меня прога, но там надо мышкой успевать нажимать в начало такта по неск раз. лучше пока ничего не придумано. человек - лучший монокомпьютер!
czaerlag
А еще была у Дюка Эллингтона песенка под названием "Antidisestablishmentarianismist".

Шах! ;))

По темпу слоуфокс, кстати, если я правильно помню )
O'Rey
А тому, кто транслитерует "защищающихся" респект и уважуха.
barsik
2N: господь с тобой! мне ваши мужУковские меряния усами (как сказала когда-то Елка) ваще по модулю ae.gif ... хоть моно, хоть поли, хоть мегаполи.... ваши физические характеристики мне без разницы, я с челами общаюсь без инвентарной оценки ag.gif
Старый сисадмин
Доджсону респект и уважуха, да

Песенка из мери поппинс - Supercalifragilisticexpialidocious.
AlexeY
Цитата(хачапури @ May 7 2008, 10:05) *

Ну, думаю никто не будет тебе мешать раскладывать загадочную "сиганал". Более того, едва ли кто-то сомневается, что ты это сможешь. ag.gif Вопрос-то был в другом - зачем?! Как это поможет найти точки начала тактов?

1. ну, понятно, что опечатка .. сигнал имелся в виду.
2. это было к тому, что спрашивалось, что такое вообще нельзя сделать.
3. ну, и не собираюсь это делать.. если, конечно, мне кто-нить за это не заплатит, думаю, 2 000 000 евро. (причем половину авансом и без возврата, в случае не реализации ae.gif )
4. отвечая на последний вопрос, НУ, вот если бы я начал исполнять первый пункт, то смог бы ответить как именно надо раскладывать и что надо применять.
Речь шла о том, как бы я начал действовать, если бы мне задали это прогать, вот. Что бы вышло/ не вышло -- не знаю.
5. поэтому единственное, что могу обсуждать,.. это почему я (гипотетичски) начал бы именно с исследования этого вопроса (а если бы он не помог, то начал что-то другое):
а. зачем вообще раскладывают: вот, в приведенной здесь фрагменте об МП3, указано зачем:
разложение раскладывает достаточно произвольный сигнал на периодические функции.. ("по частотам") ЗАЧЕМ? -- для того чтобы
i. выявить значащие частоты... т.е. оставлять коэффициенты того диапазона частот, которые слышны (другое -- можно не хранить)
ii. выявить, какие частоты есть в конкретном сигнале. (т.е. выявить доминирующие (можно, нарпимер, их оставить))
б.конкретно здесь, как можно разложить: сигнал раскладываем по более длинным периодическим функциям --- и, если, например, перед функцией G_j с периодом T_j стоит большой коэфициент (чем перед другими) -- значит, ЭТО "ПЕРИОД" исходной фунгкции... т.е. грубо говоря, это период основных (крупных) ударов
---- опять же, это грубое объяснение.. и понятно, что при реализации надо конкретно смотреть как раскладывать, по каким функциям, м.б. предварительно надо будет сделать обработку или еще предварительнное МАКРО-разложение по диапазонам частот... и т.д. и т.п.
это просто пример, почему я бы стал делать так. ag.gif
Никого другого начинать исследование и прогание с этого не заставляю... хотите -- предлагайте свои способы.
barsik
угу. есть один такой способ. это "опросить" один из высокочастотных каналов в записи на предмет выявления частоты модулирующего сигнала. Сис язвительно спрашивал, как выявить этот частотный канал, который собственно и является "тактообразующим"? отвечаю: в большинстве случаев это просто самый мощный по амплитуде сигнал. таким образом нужно просто проанализировать самый амплитудный сигнал на всех частотных каналах, плюс частота модулирующего сигнала должна попасть в промежуток 0,1 - 1 Гц. если не попадает, ищем дальше, с менее сильной амплитудой. все равно это проще, нежели сначала сложить, а потом разложить bw.gif

потому что у меня сложилось мнение (из ваших пристрастных отсылок к Фурье), что "за деревьями не видно леса" ad.gif прибегать к аппроксимирующим методам (разложению в ряд) имеет смысл, когда "первоисточники"-волновые распределения недоступны, либо их вообще не было! ae.gif а когда они рядом, в неискаженном (относительно!) виде, то что м.б. проще??
Старый сисадмин
А если сигнал нам дан просто как f(t) по какой-то причине? Например, записан на грампластинке? ;)
А метод выделения частотных каналов сработает, если основной ритм строится несколькими источниками? Например, часть мелодии ведет скрипка (ужас, ужас), часть - пианина какая-нибудь?

А Фурье - самый универсальный и прямолинейный метод, да.

И вообще, сказал от фонаря про Фурье, а тут такую теорию развели... Может, по инерции заодно придумаем короткое доказательство большой теоремы Ферма? ;)
AlexeY
Цитата(barsik @ May 8 2008, 01:32) *

угу. есть один такой способ. это "опросить" один из высокочастотных каналов в записи на предмет выявления частоты модулирующего сигнала. Сис язвительно спрашивал, как выявить этот частотный канал, который собственно и является "тактообразующим"? отвечаю: в большинстве случаев это просто самый мощный по амплитуде сигнал. таким образом, нужно просто проанализировать самый амплитудный сигнал на всех частотных каналах, плюс частота модулирующего сигнала должна попасть в промежуток 0,1 - 1 Гц. если не попадает, ищем дальше, с менее сильной амплитудой. все равно это проще, нежели сначала сложить, а потом разложить bw.gif

Это в случае, если удар -- простой объект,находящийся в одной частотной полосе.
А что делать, если нет? МММ?

Цитата(barsik @ May 8 2008, 01:32) *

потому что у меня сложилось мнение (из ваших пристрастных отсылок к Фурье), что "за деревьями не видно леса" ad.gif прибегать к аппроксимирующим методам (разложению в ряд) имеет смысл, когда "первоисточники"-волновые распределения недоступны, либо их вообще не было! ae.gif а когда они рядом, в неискаженном (относительно!) виде, то что м.б. проще??

1. Лично я к преобразованию Фурье не отсылал.
2. Ну, вообще-то в компе по-любому все приближенно хранится.. одна цитата из формата МП3 чего стоит.
3. Вот в первой цитате вообще прямо указан метод, который использует часть информации (т.е. идет разбиение (пусть и исходное) .. и выделяются значащие элементы)

Цитата(Старый сисадмин @ May 8 2008, 01:49) *

А Фурье - самый универсальный и прямолинейный метод, да.

Ну, смотря, что под Фурье понимать.. если в самом широком смысле, то это чуть ли не произвольное разложение в гильбертовом пространстве по любому базису.. .... получается типа фразы "предлагаю использовать что угодно"
barsik
2С: ну и что? ты что, в результате разложения по фурье получишь что-то более достоверное, штоле??? да ладно! тож получишь что-то невнятное, непонятно как зависящее от времени. тебе ж мониторинг не выдаст твоя "базовая" функция, с периодом в 10 секунд, скажем: тут у меня такая частота, тут - такая, а тут я ваще забылася ah.gif в конце концов, первоисточник все это выдаст с более достоверным результатом.

часть - скрипка, часть - пианина? ничего страшного, проанализируй ВСЕ существенные частотные каналы (в конце концов вы ж не ораторию анализируете, млинн! там инструментов - 2-3... ну, 7!!, ладно, но не больше ae.gif). если это - таки РИТМ, частота модулирующего сигнала совпадет по каналам "пианина" и "скрипка"... другое дело, что и пианина, и скрипка дают частоты в разных диапазонах, кратных, так сказать... ну, тут опять работает фильтр "самый амплитудный сигнал".

не, я понимаю и поддерживаю упорство физегов и фурье в этой теме ad.gif гранты нужно выбивать, ага. лопухам лапшу вешать на предмет "какая слооооожная задача!" ay.gif все прально.

хе. интересно. а как это может быть -"не удар" и не "в одной частотной полосе"? поясни, плз! я не понимаю, каким способом из музыкального инструмента можно извлечь звук, не долбанув его чем-то???? bn.gif bw.gif
AlexeY
1.про частотную полосу: я к сожалению запостил сообщение до Сиса, который мою мысль лучше выразил :))
2. про физиков, надеюсь, это не ко мне :)
3. все, что хотел сказать, уже сказал..:)) теперь я посижу по popcorn.gif очень захотелось ;)
4.
Цитата
...в конце концов, первоисточник все это выдаст с более достоверным результатом.

жду доказательства, желательно сведенного к аксиомам... т.е. доказательство теоремы:
"при любом потоке мелодии, алгоритм А работает не хуже алгоритма Б."
Если не это утверждалось.. тотогда наверное, такое:
"Вероятность того, что при потоке мелодии, алгоритм А работает не хуже алгоритма Б, больше 1-a."
Тогда заодно, пожалуйста, вероятностное пространство и чило a.
Если опять неправильно понял. Какое же точное утверждение имелось в виду. bj.gif
Старый сисадмин
Ммммм... Вот взяли и напели вальс... Мычанием таким... Хоровым... попеременно...
barsik
мычание - это тоже УДАР! грубо говоря, - связок о воздух. кто-то явно будет мычать громче всех, в силу занудства своего, его и анализируем ad.gif

2А: а ЧТО тут доказывать-то? что в результате преобразования (в аппроксимирующей модели вычисления) ВСЕГДА теряется точность? вернее, аппроксимирующая модель вычисления всегда будет только приближаться к истинной (в нашем случае - первоначальной моде, которую вы сначала сложили, а потом стараетесь вытащить, помятую, обратно ad.gif да, Сис, это маленький пионерский привет лично тебе!). это нужно доказывать? правда??? ai.gif

конечно, и тебе тоже адресовала, AlexeY! .... если только ты не математик ab.gif у вас, математиков, эти мазохизмы все "по любви", кто бы сомневался...
AlexeY
вот-вот ты ошиблась.. я не физик (и лучше меня к ним не относить ;) ) ))))))

Да, занимаюсь ей потому, что она мне нравится. (И желаю всем заниматься (в работе особенно) тем, что вам нравится! ;)) НО это не значит, что я еще что-то не могу любить или чем-то заниматься с удовальствием. В частности, я б СБТ вряд ли бы занимался.
п.2 я занимаюсь в той области, которая прикладная.. в частности, проги пишу отчасти. ...(хотя это не отменяет того, что я могу видеть красоту чистых математических исследований)
В данном случае мы обсуждаем также практическое применение...


а реально что:
а то, что ИЗВЕСТНЫЙ ФАКТ, что использование исходного материала (как есть, ПОТОМУ ЧТО ВАЖНО КАК ЕГО ДАЛЬШЕ ИСПОЛЬЗУЮТ) не факт что даст правильный ответ на какой-то определенный вопрос (скажем так,.. это даже часто приводит к очнгь длительному решению). Ибо нам нужно получить ответ не о том, как каждая частичка воды движется,.. а какие общие характеристики имеет течение,.. которые быстрее выявляются численными методами.
Надеюсь, известно, что большие простые чила ищутся вероятностными методами, а не детерминированными. Ибо последние являются очень трудоемкими. Применение: цифровая подпись.
Поговорим о пользе и важности Численных Методов? :)-- ща быстренько темку создадим ;))

п.2 я ж нигде не говорил, что надо смешать и все забыть про исходный формат!!!! речь идет о том, как быстро выявить и с высокой вероятностью нужный период. Я предложил способ(даже просто идею начала исследования, А не конкретный алгоритм). При этом ничего не утверждал про него.

Но в указанной мной цитате были слова " первоисточник все это выдаст с более достоверным результатом" -- это уже утверждение.
Требую доказательства, а не слов. :-P Варианта два:
- предъявляется реализация с набором типичных тестов + Заявление: "предъявите лучше" -- прогерский подход (практическое)
- предъявляется формализация утверждения и его доказательство --
математический подход (теоретическое)

третьего не дано. :-D
NeProff
то Барсик и Сисик:
А что вы скажете на то, что частота широкополосной модуляции не квазиизотропна по отношению к отдельным полосам гармоник высших порядков, выбранных по принципу пикового значения ?????? ae.gif ae.gif ae.gif математика тут уже не спасет
czaerlag
Однако, какую богатую тему мне посчастливилось поднять.... ai.gif
O'Rey
Цитата
частота широкополосной модуляции не квазиизотропна по отношению к отдельным полосам гармоник высших порядков


Более того!
Античная метрика требует в фалековом гендекасиллабе большой постоянной цезуры после арсиса третьей стопы!
Reaper
Орей гонит. Не слушайте его.


Странно, 5 страница, а обсуждение все еще по теме... (с) баш
barsik
я каэшн, дико извиняюсь, но вы все-таки за деревьями точно потеряли лес!
зачем такой софт? - вроде бы, как заявлялось, для определения тактового числа мелодии. я так понимаю, имеет смысл для ТАНЦЕВАЛЬНОЙ музыки, правда? т.е. под это - танцуют. то есть это музыка с четким ритом (изначально, иначе вы б ее не выбрали вовсе).
для танцевальной музыки характерно все то, что я описывала выше и не надо пытаться быть святее папы римского (а именно это хочет сделать, имхо, AlexeY, пытаясь отфильтровать "модулятор", который был бы КРАСИВЕЕ и ТОЧНЕЕ изначального инструмента, ритм задававшего). если вы возьмете, к примеру, джазовую импровизацию, там ваще все скиснет сразу, - и с фурье-разложением, и без него, там же временами ритм меняется "как бог на душу положит" просто!!
как говорилось в древней рекламе, ставьте себе реальные задачи! и все будет ок ag.gif

2N: а ты не пристрастен, кисо, нет? ad.gif умничает в терминах тут один чел, а подтруниваешь ты над совсем другими. и причем тут Сис вообще??

с "прогерством" у меня давно закончены все отношения, уважаемый AlexeY, я - пас, уж извини. если у тебя хватит энергии, можешь сам все проверить. а на "теоретический подход" тем более жалко времени. в конце концов я тоже щяз встану в 1-ю позицию и скажу: нееееет!! представляй доказательства! ad.gif
.... хотя не зарекаюсь, когда-нибудь может и займусь. когда совсем делать нечего будет ab.gif
AlexeY
Цитата(barsik @ May 8 2008, 14:33) *

..... (а именно это хочет сделать, имхо, AlexeY, пытаясь отфильтровать "модулятор", который был бы КРАСИВЕЕ и ТОЧНЕЕ изначального инструмента, ритм задававшего).....

Пожалуйста, цитатку, где это я хочу сделать? :)

Цитата(barsik @ May 8 2008, 14:33) *

с "прогерством" у меня давно закончены все отношения, уважаемый AlexeY, я - пас, уж извини. если у тебя хватит энергии, можешь сам все проверить. а на "теоретический подход" тем более жалко времени. в конце концов я тоже щяз встану в 1-ю позицию и скажу: нееееет!! представляй доказательства! ad.gif
.... хотя не зарекаюсь, когда-нибудь может и займусь. когда совсем делать нечего будет ab.gif

тогда ТО утверждение (все согласны) приведено без доказательства. Значит, считаем его ТОЛЬКО гипотезой ;))
Это текстовая версия - только основной контент. Для просмотра полной версии этой страницы, пожалуйста, нажмите сюда.