Как говорит человек можно сказать какой он. Интонации голоса и характер

Благодаря ему мы говорим, выражаем эмоции, показываем любовь или ненависть, управляем и даже манипулируем людьми. Голос влияет на все сферы нашей жизни. Ваш успех часто определяется только качеством голоса.

Высокий голос - низкие должности?

Безусловно, высокий голос чаще всего раздражает слушателей. Этот дискомфорт связан с тем фактом, что пронзительные звуки вызывают обеспокоенность. Поэтому очень высокий голос, который время от времени переходит на визг, часто мешает его обладателю наладить отношения с людьми, так как он отвлекает и очень раздражает барабанные перепонки.

Низкий голос и сексуальная привлекательность

Обладатели низких тембров - часто самоуверенные и самодостаточные интеллектуалы. Этот факт базируется на физиологических характеристиках организма и на том, как мы их воспринимаем. Американский психолог Сюзан Хагис считает, что низкий голос характерен для мужчин и женщин, которые обладают традиционной гетеросексуальной привлекательностью, то есть такие женщины имеют средние плечи, среднюю или большую грудь, узкую талию и бедра, объем которых гармонирует с шириной плеч, а мужчины - широкие плечи и узкие бедра. Считается, что эти признаки говорят о физическом здоровье и зрелости, а потому такой человек считается самостоятельным и способным принимать важные решения.

Состоятельным - бархатный голос, начальникам - громкий

Люди, которые постоянно командуют и отчитывают других, не сомневаясь в собственной правоте, как правило очень громкие не только на работе, но и дома. Они или не умеют владеть собой, или им недостает самокритичности. Сдержанный и скромный человек говорит тихо и вкрадчиво. Если к тихому голосу прибавляется робость или просительная интонация, то перед вами неуверенный в себе человек. Постоянные перепады голоса говорят о повышенной эмоциональности или о волнении.

Быстрая речь - насыщенная жизнь

Скорость речи соотносится с темпераментом человека и ритмом его жизни. Спокойные, люди, не склонные к риску и резким перепадам настроения, говорят медленно и не спеша. Холерики зачастую излишне эмоциональные и громкие, они говорят очень быстро и часто жестикулируют.

Немаловажной является также дикция. Чем четче говорит человек, тем определеннее его жизненная позиция, тем проще и яснее его взгляд на мир.

Не забывайте также про собственную речь. Хотя бы в целях маскировки (например, в волнительных ситуациях) старайтесь говорить четко и разборчиво, чтобы никто не заподозрил вас в неуверенности. Хорошая дикция и достаточно громкий голос сразу покажут людям, кто вы есть на самом деле.

Обратите также внимание на использование в обыденной речи редких слов и оборотов. Человек, который говорит так, как никто из окружающих, часто цитируя известных авторов и приукрашая речь разнообразными эпитетами и метафорами, явно стремится выделиться и подчеркнуть свою исключительность.

Читайте також:

Конверты уже успели завоевать всеобщую признательность среди молодых родителей на Украине. Заглядывая немного в историю мы можем увидеть, что предыдущие поколения мам также пользовались этим прекрасным изобретением. И все потому что эта вещь удобна как для родителей (малыша можно одеть для прогулки в считанные секунды), так и для малышей (малышу обеспечивается свобода движения, комфортная температ...

Как считает продюсер Эльвира Гаврилова (https://elvira-gavrilova.com/) - личный бренд играет решающую роль в продвижении инновационного продукта на российском и зарубежном рынке. Сегодня между корпорациями и предпринимателями идет война за покупателей и заказчиков, наблюдается значительная конкуренция. Поэтому для привлечения внимания и лояльности аудитории необходимо предлагать исключительн...

Сегодня жизнь диктует очень быстрый темп и современные мамы, как никто другой это чувствуют на себе. Большое количество дел, уход за ребенком или же несколькими детьми, а иногда и работа в декретном отпуске просто не оставляют времени на себя. Первыми из жизни мам уходит маникюр и педикюр. Однако мы знаем, как это исправить. Обычно, процедуру маникюра и покрытия лаком приходится повторять...

Четкая, быстрая и напористая речь говорит о том, что перед вами активный, энергичный человек, который может сначала сделать и только потом подумать. Именно к таким людям чаще применяют фразу «Наломал дров».

Человека, который во главе своей жизненной деятельности ставит анализ, можно узнать по неторопливой, взвешенной речи. Не спешите радоваться торопливому словесному потоку, в котором потеряны окончания слов и логическая связь. Это совершенно не означает, что ваш собеседник предпочитает больше действовать, чем говорить. Вероятно, он просто несобранный.

О напряжении, металлических нотках и громком голосе

Резкие голосовые колебания указывают на то, что собеседник находится в процессе самовыражения. Такие интонации чаще присущи подросткам. Сталкиваясь с неизвестными жизненными ситуациями, они легко меняют привычные стереотипы мышления и поведения. Даже самая маленькая неудача в жизни способна пробудить острую реакцию на происходящее.

Напряжение в голосе – контроль каждого шага. Возможно, это высоко ценится начальством и коллегами, но весьма неприятно близким. Таким людям чуждо понятие «душевного тепла», они полностью погружены в работу, отличаются замкнутостью и самодисциплиной.

Хозяину голоса с металлическими нотками присуща всеподавляющая энергия и воля, ему под силу сломить любое сопротивление. На желание доминировать и контролировать указывает чрезмерно громкий голос. Если ко всему прочему присоединяется частое перебивание собеседника, значит, перед вами человек, центральным качеством которого является эгоизм. Ошибочно мнение о том, что громкая речь указывает на уверенность, чаще это всего лишь желание привлечь внимание.

Звонкий и высокий голос

Звонкий голос порождает мысли об энергичности и юности собеседника, которая нередко граничит с незрелостью и неопытностью. Стоит отметить, что при восприятии слишком звонкого голоса снижается уровень доверия к сказанному.

Абсолютной противоположностью будет уверенный и спокойный голос, указывающий на то, что его обладатель знает, как подать себя миру. Главный конек таких людей – самодисциплина и самоконтроль.

Что можно сказать о громкоговорящем человеке? Что его эмоциональное состояние возбуждено, что он не может владеть собой, он зол.

Если человек говорит быстро, напористо, то такой человек сначала делает, а потом думает. О человеке, который говорит медленно и взвешенно, можно сказать, что этот человек склонен взвешивать и обдумывать свои поступки.

Если во время разговора темп речи ускоряется, сопровождается жестами, то этот человек представляет себе то, о чем он говорит. Если же речь, при разговору, замедляется, становится тише, то это говорит об неуверенности говорящего. Если речь путается или понижается, потом оживляется, то перед нами неуправляемый человек.

Громкость речи тоже говорит о многом: пронзительный, срывающийся голос указывает на страх или сильное волнение оратора. Низкий, спокойный голос указывает на достоинство и уверенность. Четкое произношение свидетельствует о дисциплинированном человеке, а неразборчивая речь говорит, что у собеседника нет уважения к окружающим и его не беспокоит, что его не понимают.

Интонация голоса выдает человека, даже если, он всячески пытается это скрывать. По интонации можно определить добрый или злой человек, скромен или высокомерен. Даже не понимая всех слов и, еще не умея говорить, ребенок понимает по эмоциональности речи, каков человек: добрый или злой.

Будьте внимательны и изучайте людей по их голосу.

Можно человека не видеть, но стоит услышать его голос, как воображение тут же дорисовывает его портрет. По голосу мы интуитивно чувствуем, насколько открыто и непринуждённо мы можем общаться с собеседником. Двух одинаковых голосов в мире не существует.

Женщин привлекают сочные баритоны, мужчин – грудные, как будто изнутри льющиеся женские голоса. И это напрямую связано с сексуальностью. Если наша кожа – это проекция работы желудка, язык – иммунной системы, то голос – проекция половых органов. Оперные певицы своими трелями вводили мужчин в состояние, близкое к экстазу. Обнаружив связь между голосовым аппаратом и состоянием гениталий, гинекологи и акушеры разработали голосовые практики, которые снижают боль и расслабляют мышцы малого таза, и облегчают роды.

Российские учёные провели исследование, в котором слушателям предложили по голосу определить возраст человека, произносившего одну и ту же фразу с разными эмоциями. Эмоции гнева и страха увеличивали возраст незнакомца лет на десять, а радость и доброжелательность – мгновенно омолаживали. Такую психологическую особенность следует взять на заметку тем, кто хочет долго не стареть.

Например, женщины с высокими нотками в голосе, как правило, быстро говорят, их называют болтушками. Таким образом, они убегают от своих переживаний, забалтывают нерешённые проблемы. Они пасуют перед агрессией общества, боятся жизненных препятствий.

Силу голоса крадёт и городская жизнь. В мегаполисе не принято громко кричать, петь, говорить, выражая эмоции. Малыши обычно в первые годы жизни пренебрегают такими запретами, но в определённый момент их начинают «заглушать» родители, воспитатели, учителя. Если напор запретов будет слишком велик, человек потеряет свою внутреннюю силу.

Чтобы остаться сильной личностью, полезно почаще давать волю своему голосу. Ищите любую возможность. Например, за городом, позвольте себе звучать – аукайте, кричите, слушайте эхо своего голоса. Пойте караоке, пойте с друзьями застольные песни. Дома приучите себя напевать или хотя бы мурлыкать под нос любую мелодию. Держите прямую осанку и смотрите собеседнику в глаза, это сделает решительнее и Ваш голос и Вас самих. Играйте с детьми, копируйте голоса мультяшных героев и животных. Хохочите, а не хихикайте, рыдайте, а не сдерживайте слёзы, кричите, а не сдерживайте гнев.

Интонации голоса меняются в зависимости от эмоционального или физического состояния. Важно обнаружить определенные закономерности. Если какая то характеристика неизменно проявляется, то можно делать вывод о возможных мыслях или поступках другого человека.

Речевых характеристик очень много, поэтому имеет смысл фокусироваться на наиболее информативных из них:

Время от времени встречаются люди с громким голосом. Что кроется за этим? Для оценки значимости этого необходимо понять, в каких ситуациях человек говорит громко. Чаще всего громкий голос принадлежит людям, которые пытаются контролировать ситуацию и людей. Громкость несколько подавляет, а иногда даже пугает.

Поэтому люди, стремящиеся к доминированию, использующие авторитарный способ управления, часто пользуются этим приемом. В отдельных случаях манера громко говорить у человека может сочетаться с постоянным перебиванием собеседника. Это не только попытка установить контроль над ситуацией, но и свидетельство эгоизма и невоспитанности. Некоторые считают, что громкий голос отвечает уверенным в себе людям. Однако во многих случаях это не так. Скорее, громко говорят люди, желающие, чтобы на них обратили внимание. Другого способа привлечь к себе внимание они не знают, то есть речь идет о демонстративности поведения.

Часто приходится наблюдать, когда громким голосом люди пытаются компенсировать маленький рост, плохое телосложение и т. д.

Порой манера громко говорить отражает нежелание проявлять внимание к собеседникам. Люди, уверенные в себе, прибегают к громкому голосу редко и к месту, чаще всего для определенного давления.

Тихий голос может принадлежать человеку, уверенному в себе, который не видит необходимости доминировать в разговоре или привлекать к себе внимание. Тихий голос иногда указывает, наоборот, на нерешительность, отсутствие настойчивости. Часто таким голосом обладают люди высокомерные, вынуждающие своей манерой говорить прислушиваться к ним.

В шумных местах человек, обычно говорящий тихо, вынужден начать говорить громче. Если этого не происходит, значит, ему не хватает наблюдательности, восприимчивости, возможно, он чрезмерно высокомерен.

Если в процессе общения человек говорит тихо, спокойно смотрит в глаза, его жесты неторопливы, то ситуация в целом для него комфортна. Тихий голос может сочетаться с нежеланием смотреть в глаза и суетливыми жестами. Значит, человек испытывает дискомфорт, возможно, ему не хватает уверенности в себе.

В любом случае стоит присматриваться к выражению глаз и жестам.

Быстрая речь

Надо различать постоянную быструю речь и реакцию на определенные обстоятельства. Замечено, что чаще всего люди с быстрой речью весьма активны и умеют, не задумываясь, принимать решения. Этому типу людей иногда не хватает осторожности, чрезмерная импульсивность приводит в некоторых случаях к поспешным выводам.

В отдельных случаях быстрая речь служит компенсацией неуверенности, желанием привлечь к себе внимание. И то и другое обусловлено низкой самооценкой.

Убыстренная речь может указывать и на ложь собеседника. Слова слетают с его губ быстро, так как он желает скорее освободить себя от ложной информации. Под потоком слов легче скрыть правду.

В подобных ситуациях надо обратить внимание на другие сигналы и понять, нет ли в них признаков волнения или неуверенности.

Медленная речь

Наиболее часто встречаются два следующих варианта. Медленно, спокойно и тихо говорят уверенные в себе люди. Медленно говорят и люди, находящиеся в состоянии дискомфорта, на что должны указывать другие сигналы.

Иногда в процессе разговора говорящий может замедлить свою речь, если он хочет подчеркнуть какой то важный момент, если его что то беспокоит или смущает, если он сочиняет или устал.

Глубоко задумавшиеся люди часто замедляют свою речь.

Запинающаяся речь

В речи некоторых людей много остановок и пауз. Медленная речь имеет свой ритм, в запинающейся речи пауза возникает чаще всего неожиданно, продолжительность пауз тоже меняется. Паузы могут быть вызваны неуверенностью, нервозностью, смущением. Иногда это указывает на неискренность. Но вероятна и обратная ситуация. Человек хочет высказаться более точно, он подыскивает слова, в результате возникает пауза.

Чтобы определить, чем обусловлена пауза, стоит присмотреться к языку тела. Человек может начать запинаться, если он взволнован или лжет. Желательно обратить внимание на его глаза, частоту дыхания, жесты. По этим признакам и надо судить о состоянии человека. Лгун будет не только запинаться, но и избегать взгляда собеседника, прикрывать ладонью рот или другие части лица.

Нервный человек сопровождает речь с паузами суетливыми движениями рук и ног. Если же человек всего лишь стремится точно выразить свою мысль, то его концентрированность должна проявиться в глазах и жестах.

Конечно, желание сконцентрировать свое внимание приводит к таким же паузам, которые часто возникают в речи очень болтливых людей. Но у последних пауза связана с потерей нити разговора, о чем очень выразительно говорят движения глаз.

В отдельных случаях медленная речь переходит в явное запинание, что, скорее всего, связано с большой нервозностью, а может быть, даже и с заболеванием.

В большинстве случаев голос становится выше от радости, страха, возбуждения и т. д. Голос «срывается» от большого эмоционального напряжения. Различные эмоциональные состояния подтверждаются языком тела, поведением людей.

Когда человек устал, загрустил, подавлен или желает произвести на других впечатление, то голос становится значительно ниже. Но и в этом случае необходимо обратить внимание на язык тела.

Речевые ударения

Надо внимательно прислушиваться к речевым ударениям. Желая подчеркнуть какое то слово и мысль, говорящий может использовать речевое ударение. Его легко распознать, если одновременно воспринимать язык тела. Например, одновременно с речевым ударением говорящий иногда наклоняется вперед, кивает головой, поднимает руку и т. д. Еще раз подтверждается правило, что желательно научиться замечать в поведении собеседника отклонение от стереотипности, привычного. Тогда удается понять как намерения человека, так и его характер.

Заметив у собеседника безразличный или ровный голос, обратите внимание на язык тела. Слабо интонационно окрашенный голос может отвечать тревоге, скуке, депрессии, потере интереса. Ровным голосом иногда пытаются замаскировать сильные чувства, например обиду, ревность, зависть. Причину надо искать, опять же, в языке тела. Это позволит вам правильно определить свои дальнейшие действия.

Претенциозность в голосе, напыщенность могут быть объяснены разными причинами. Так ведут себя люди, неуверенные в себе, жаждущие признания и одобрения со стороны других людей. Они хотят выглядеть в их глазах преуспевающими, богатыми, умными и т. д.

Кстати, претенциозность человека очень ярко отражается в его подписи. Аффектирование больших заглавных букв, подчеркивание, крупные строчные буквы выдают в человеке снобизм. Но и здесь надо быть очень внимательным. Если воспитание не соответствовало характеру человека, то в написании инициала имени видна претенциозность, а в написании фамилии уже проявляются истинные черты характера.

Придыхание

Обычно мы не слышим в разговоре дыхание собеседника. Когда же это происходит, надо постараться выяснить причины. С сознательным придыханием чаще всего связывают сексуальный интерес. Но оно может быть обусловлено и другими причинами. Например, волнением, большой нагрузкой, недоверием, нервозностью или стрессом. Подсказку можно получить, обращая внимание, опять же, на язык тела. Обычно нервное состояние проявляется не только в неравномерном дыхании, но и в поведении, например в чрезмерном употреблении воды или преувеличенных жестах рук. Недоверие, как правило, сопровождается покачиванием головы или другими жестами.

Чаще всего это один из способов манипулирования собеседником без помощи слов, прибегая к жалобным и протяжным звукам или даже рыданиям. Обычно роль нытиков играют ведомые. Им не хватает сил и уверенности в себе. Им хочется, чтобы о них заботились другие. Нытики хорошо чувствуют слабинку в другом человеке, поэтому по отношению к ним лучше сразу же занять определенную позицию.

Невнятная речь

Чаще всего невнятная речь обнаруживается у неуверенных в себе людей, не умеющих выражать свои мысли, тревожных, застенчивых или усталых. Люди с такой манерой говорить не являются лидерами, не стремятся к руководству, им не хватает жизнерадостности и энергичности. Для них характерны вялые движения, слабые рукопожатия, усталость от жизни.

Магия звука

Каждый должен знать, что не существует другого такого голоса, как у него; и если эта специфичность теряется, то возникает фальшь.

По голосу человека можно определить его характер, настроение и даже душевные свойства. Тембр голоса, как и неповторимый узор отпечатков пальцев, строго индивидуален, а в США, Англии и Италии запись голоса считается неоспоримым юридическим документом, подделать который невозможно.

Кому то от природы дается приятный голос, а кому то приходится жить с противным. Но всегда есть выход – над голосом можно работать. При умелом использовании речь и голос становятся мощным психологическим оружием, действующим на подсознание собеседника.

В настоящее время психологами выявлены основные эмоциональные реакции человека на различные вариации высоты и тембра голоса собеседника.

Высокий и звонкий голос ассоциируется с юностью, энергичностью и, увы, с незрелостью и неопытностью. По статистике женщин и (особенно) мужчин с таким голосом значительно реже назначают на солидные посты. Сделано интересное наблюдение: чем выше голос, тем ниже должность.

Более того, пронзительный, высокий звук прочитывается подсознанием как сигнал тревоги. Таким образом, длительно звучащий высокий голос вызывает у собеседника невольное чувство дискомфорта и уменьшает степень доверия к словам. Обладатель очень высокого голоса должен более чем кто либо другой обратить внимание на содержание и интонационную составляющую своей речи.

Обладателям низкого голоса повезло больше: такой голос ассоциируется с самодостаточностью, уверенностью, интеллектом. Человека с низким голосом окружающие воспринимают как знающего, более авторитетного. Чем ниже голос мужчины, тем сильней и надежней он выглядит в глазах женщины.

Один только низкий бархатный голос человека, которого мы никогда не видели, может вызвать сильнейшее чувство любви. Это обусловлено подсознательным считыванием генокода собеседника. Дело в том, что низкий голос обусловлен повышенным содержанием мужских половых гормонов в крови, следовательно, обладатель такого голоса более темпераментен. Именно поэтому женщина с низким грудным голосом, богатым интонациями, кажется мужчинам более сексуальной, чем обладательница монотонно звучащего тонкого голоска.

По голосу человека можно определить его характер, настроение и даже душевные свойства. Тембр голоса, как и неповторимый узор отпечатков пальцев, строго индивидуален, а в США, Англии и Италии запись голоса считается неоспоримым юридическим документом, подделать который невозможно.

Кому-то генетически дается приятный голос, а кому-то приходится жить с «противным». Но всегда есть выход – над голосом можно работать. При умелом использовании, речь и голос становятся мощным психологическим оружием, действующим на подсознание собеседника.

Психологи выявили основные эмоциональные реакции человека на различные вариации высоты и тембра голоса собеседника.

Высокий и звонкий голос ассоциируется с юностью, энергичностью и, увы, с незрелостью и неопытностью. По статистике женщин и (особенно) мужчин с таким голосом значительно реже назначают на солидные посты. Сделано интересное наблюдение, чем выше голос, тем ниже должность.

Более того, пронзительный, высокий звук прочитывается подсознанием как сигнал тревоги. Таким образом, длительно звучащий высокий голос вызывает у собеседника невольное чувство дискомфорта и уменьшает степень доверия к словам. Обладатель очень высокого голоса должен более чем кто-либо другой обратить внимание на содержание и интонационную часть своей речи.

Обладателям низкого голоса повезло значительно больше: он ассоциируется с самодостаточностью, уверенностью, интеллектом. Человека с таким голосом окружающие воспринимают как знающего, а, следовательно, более авторитетного. Чем ниже голос мужчины, тем сильней и надежней он выглядит в глазах женщины. Кстати, статистика не отрицает также влияния голоса на успех у противоположного пола. Вы наверняка отмечали возникновение романтических мыслей, общаясь по телефону с незнакомым мужчиной, обладающим приятным тембром голоса.

Один только низкий бархатный голос человека, которого мы никогда не видели, может вызвать сильнейшее чувство любви. Это обусловлено подсознательным считыванием генокода собеседника. Дело в том, что низкий голос обусловлен повышенным содержанием мужских половых гормонов в крови, следовательно, обладатель такого голоса более темпераментен. Именно поэтому женщина с низким, грудным голосом, богатым интонациями кажется мужчинам, более сексуальной, чем обладательница монотонно звучащего тонкого голоска.

Следите за осанкой – при хорошей осанке органы дыхания расположены правильно, что позволяет ему быть лёгким и свободным. Звук должен выходить из груди. Чтобы проверить правильность выполнения упражнения положите руку на грудь, если она вибрирует – Вы на верном пути.

Укрепляет дыхание и улучшает звучание голоса занятие пением. Оставшись в квартире наедине с собой и домашними заботами, попробуйте что-нибудь достаточно громко спеть. Надувайте воздушные шарики – это очень укрепляет дыхательную систему, советует "Гороскоп. ру".

Разнообразьте речь интонациями, особенно если Вы склонны подавать информацию «на одной ноте». Несколько раз прочитайте вслух небольшой отрезок текста (лучше всего стихотворение), с каждым новым прочтением наполняя его новыми интонациями.

Научитесь четко формулировать мысль, которую Вы хотите донести до слушателя. Это избавит вас от предательского «мычания» в паузах между смысловыми отрезками речи. Запаситесь аргументами в пользу своего мнения, правильно расставляйте акценты.

Невозможно убедить кого-то в чем-то, тихо прожевывая фразы. Помните, что информация, поданная всего на полдецибела громче, гораздо успешнее убеждает слушателя и лучше усваивается им. Установите оптимальный «уровень громкости» для своего голоса. Посчитайте вслух, от одного до десяти, постепенно повышая голос, когда услышите то звучание, которое вас устроит, запомните его, а затем постарайтесь ему следовать.

Здравствуй, дорогой читатель!

Предлагаю твоему вниманию интересную и познавательную статью об отдельно взятом методе распознавания говорящего. Всего каких-то пару месяцев назад я наткнулся на о применении мел-кепстральных коэффициентов для распознавании речи. Она не нашла отклика, вероятно, из-за недостаточной структурированости, хотя материал в ней освещен очень интересный. Я возьму на себя ответственность донести этот материал в доступной форме и продолжить тему распознавания речи на Хабре.

Под катом я опишу весь процесс идентификации человека по голосу от записи и обработки звука до непосредственно определения личности говорящего.

Запись звука

Наша история начинается с записи аналогового сигнала с внешнего источника с помощью микрофона. В результате такой операции мы получим набор значений, которые соответствуют изменению амплитуды звука со временем. Такой принцип кодирования называется импульсно-кодовой модуляцией aka PCM (Pulse-code modulation). Как можно догадаться, «сырые» данные, полученные из аудио-потока, пока еще не годятся для наших целей. Первым делом нужно преобразовать непослушные биты в набор осмысленных значений — амплитуд сигнала. В качестве входных данных я буду использовать несжатый 16-битный знаковый (PCM-signed) wav-файл с частотой дискретизации 16 кГц.

Double readAmplitudeValues(bool isBigEndian) { int MSB, LSB; // старший и младший байты byte buffer = ReadDataFromExternalSource(); // читаем данные откуда-нибудь double data = new double; for (int i = 0; i < buffer.length; i += 2) { if(isBigEndian) // задает порядок байтов во входном сигнале { // первым байтом будет MSB MSB = buffer; // вторым байтом будет LSB LSB = buffer; } else { // наоборот LSB = buffer; MSB = buffer; } // склеиваем два байта, чтобы получить 16-битное вещественное число // все значения делятся на максимально возможное - 2^15 data[i] = ((MSB << 8) || LSB) / 32768; } return data; }
Освежить знания про порядок байтов можно на википедии .

Обработка звука

Полученные значения амплитуд могут не совпадать даже для двух одинаковых записей из-за внешнего шума, разных громкостей входного сигнала и других факторов. Для приведения звуков к «общему знаменателю» используется нормализация . Идея пиковой нормализации проста: разделить все значения амплитуд на максимальную (в рамках данного звукового файла). Таким образом мы уравняли образцы речи, записанные с разной громкостью, уложив все в шкалу от -1 до 1. Важно, что после такой трансформации любой звук полностью заполняет заданный промежуток.

Нормализация, на мой взгляд, — самый простой и эффективный алгоритм предварительной обработки звука. Существуют также масса других: «отрезающие» частоты выше или ниже заданной, сглаживающие и др.

Разделяй и властвуй

Даже при работе со звуком с минимально достаточной частотой дискретизации (16 кГц) размер уникальных характеристик для секундного образца звука просто огромен — 16000 значений амплитуд. Производить сколь-нибудь сложные операции над такими объемами данных не представляется возможным. Кроме того, не совсем понятно, как сравнивать объекты с разным количеством уникальных черт.

Для начала снизим вычислительную сложность задачи, разбив ее на меньшие по сложности подзадачи. Этим ходом убиваем сразу двух зайцев, ведь установив фиксированный размер подзадачи и усреднив результаты вычислений по всем задачам, получим наперед заданное количество признаков для классификации.


На рисунке изображена «порезка» звукового сигнала на кадры длины N с половинным перекрытием. Необходимость в перекрытии вызвана искажением звука в случае, если бы кадры были расположены рядом. Хотя на практике этим приемом часто принебрегают для экономии вычислительных ресурсов. Следуя рекоммендациям , выберем длину кадра равной 128 мс, как компромисс между точностью (длинные кадры) и скоростью (короткие кадры). Остаток речи, который не занимает полный кадр, можно заполнить нулями до желаемого размера или просто отбросить.

Для устранения нежелаетльных эффектов при дальнейшей обработке кадров, умножим каждый элемент кадра на особую весовую функцию («окно»). Результатом станет выделение центральной части кадра и плавное затухание амплитуд на его краях. Это необходимо для достижения лучших результатов при прогонке преобразования Фурье , поскольку оно ориентировано на бесконечно повторяющийся сигнал. Соответственно, наш кадр должен стыковаться сам с собой и как можно более плавно. Окон существует великое множество . Мы же будем использовать окно Хэмминга.

n - порядковый номер элемента в кадре, для которого вычисляется новое значение амплитуды
N - как и ранее, длина кадра (количество значений сигнала, измеренных за период)

Дискретное преобразование Фурье

Следующим шагом будет получение кратковременной спектрограммы каждого кадра в отдельности. Для этих целей используем дискретное преобразование Фурье .

N - как и ранее, длина кадра (количество значений сигнала, измеренных за период)
x n - амплитуда n-го сигнала
X k - N комплексных амплитуд синусоидальных сигналов, слагающих исходный сигнал

Кроме этого, возведем каждое значение X k в квадрат для дальнейшего логарифмирования.

Переход к мел-шкале

На сегодняшний день наиболее успешными являются системи распознавания голоса, использующие знания об устройстве слухового аппарата. Несколько слов об этом есть и на Хабре . Если говорить вкратце, то ухо интерпретирует звуки не линейно, а в логарифмическом масштабе. До сих пор все операции мы проделывали над «герцами», теперь перейдем к «мелам». Наглядно представить зависимость поможет рисунок.


Как видно, мел-шкала ведет себя линейно до 1000 Гц, а после проявляет логарифмическую природу. Переход к новой шкале описывается несложной зависимостью.

m - частота в мелах
f - частота в герцах

Получение вектора признаков

Сейчас мы как никогда близко к нашей цели. Вектор признаков будет состоять из тех самых мел-кепстральных коэффициентов. Вычисляем их по формуле

c n - мел-кепстральный коэффициент под номером n
S k - амплитуда k-го значения в кадре в мелах
K - наперед заданное количество мел-кепстральных коэффициэнтов
n ∈

Как правило, число K выбирают равным 20 и начинают отсчет с 1 из-за того, что коэффициент c 0 несет мало информации о говорящем, так как является, по сути, усреднением амплитуд входного сигнала.

Так кто же все-таки говорил?

Последней стадией является классификация говорящего. Классификация производится вычислением меры схожести пробных данных и уже известных. Мера схожести выражается расстоянием от вектора признаков пробного сигнала до вектора признаков уже классифицированного. Нас будет интересовать наиболее простое решение — расстояние городских кварталов .

Такое решение больше подходит для векторов дискретной природы, в отличие от расстояния Евклида.

Внимательный читатель наверняка помнит, что автор в начале статьи упоминал про усреднение признаков речевых кадров. Итак, восполняя этот пробел, завершаю статью описанием алгоритма нахождения усредненного вектора признаков для нескольких кадров и нескольких образцов речи.

Кластеризация

Нахождение вектора признаков для одного образца не составит труда: такой вектор представляется как среднее арифметическое векторов, характеризующих отдельные кадры речи. Для повышения точности распознавания просто необходимо усреднять результаты не только между кадрами, но и учитывать показатели нескольких речевых образцов. Имея несколько записей голоса, разумно не усреднять показатели к одному вектору, а провести кластеризацию, например с помощью метода k-средних .

Итоги

Таким образом, я рассказал о простой но эффективной системе идентификации человека по голосу. Резюмируя, процесс распознавания построен следующим образом:
  1. Собираем несколько тренировочных образцов речи, чем больше — тем лучше.
  2. Находим для каждого из них характеристический вектор признаков.
  3. Для образцов с известным автором проводим кластеризацию с одним центром (усреднение) или несколькими. Приемлемые результаты начинаются уже с использованием 4-х центров для каждого диктора.
  4. В режиме опознавания находим расстояние от пробного вектора до изученных во время тренировки центров кластеров. К какому кластеру пробная речь окажется ближе — к такому диктору и относим образец.
  5. Можно экспериментально установить даже некоторый доверительный интервал — максимальное расстояние, на котором может находиться пробный образец от центра кластера. В случае превышения этого значения — классифицировать образец как неизвестный.

Я всегда рад полезным комментариям по поводу улучшения материала. Спасибо за внимание.

Когда мы слышим другого человека, то интуитивно можем нарисовать его образ: старый или молодой, толстый или худой, низкий или высокий, добрый или злой, скромный или заносчивый и так далее.

Центры человеческого мозга, ответственные за восприятие и оценку эмоционального окраса речи и звуков, начинают свою работу с момента рождения. Малыш двух недель отроду еще не понимает значение слов, но интонацию, с какой они сказаны, определяет безошибочно.

Благодаря этой способности мы можем по голосу определить характер человека, идентифицировать его личность, то есть составить физиологический и психологический портрет. Существуют определенные стереотипы восприятия человека: по тому, как мы «звучим» можно судить об уровне интеллекта, о роде занятий, темпераменте.

К примеру, если человек разговаривает четко, быстро, напористо, то он довольно энергичен и активен, сначала сделает, потом подумает. Если его речь медленная, он будто взвешивает слова, то этот человек нетороплив, подходит к любому вопросу обстоятельно, анализирует ситуацию и прежде чем отрезать, отмерит семь раз.

Если говорящий проглатывает окончания, его речь логически несвязана и похожа на скороговорку, то в жизни он такой же несобранный. Любые изменения физического состояния или настроения отражаются в речи. Это хорошо известно представителям многих профессий — психологам, следователям, политикам, менеджерам. Они с успехом пользуются этими знаниями для манипулирования окружающими людьми, достижения своих задач.

Так, талантливый дипломат и политик Талейран, мог искусно изменять свою речь на нечленораздельное бормотание себе под нос с целью отказа от своих слов впоследствии. Свой отказ Талейран объяснял тем, что его неправильно поняли.

К своему голосу мы привыкаем и себя не «слышим». А значит, можем и не подозревать о том, что оттенки, тон или тембр голоса могут создавать о нас представление противоположное тому, которое мы хотим производить на окружающих. Интонации голоса могут рассказать о многих чертах характера человека.

Резкие голосовые колебания вниз и вверх
Человек только учится самовыражаться, возможно находится на уровне подросткового развития. Столкновение с неизвестными жизненными ситуациями ломает его привычные стереотипы поведения и мышления.

Возможно, он крайне неуравновешен, легко поддается сменам настроения. Голос отражает его взлеты и падения, причем, на неудачи он реагирует крайне остро.

Напряженные интонации в голосе
Обладатель голоса контролирует каждый свой шаг, вдох и выдох. Это импонирует его коллегам и начальству, но напрягает близкое окружение. Ведь в его обществе мало душевного тепла, он слишком замкнут, поглощен работой и самодисциплиной.

Громкий голос
Человек стремится доминировать во всем, контролировать людей и ситуацию. Частое перебивание собеседников при этом говорит о невоспитанности и эгоизме. Существует ошибочное мнение, что громкая речь – признак уверенности. Часто таким способом пытаются привлечь к себе внимание.

Иногда громко разговаривают люди маленького роста или с плохим телосложением, стремясь компенсировать свои физические недостатки. По-настоящему уверенные в себе люди редко разговаривают громко, это всегда получается уместно и, как правило, для оказания давления.

Спокойный и уверенный голос, четкая дикция
Человек имеет четкое представление о том, как подать себя миру. Саморуководство и самодисциплина - его конек. Благодаря им он добился хороших результатов. Однако в общении с ним может возникнуть ощущение театральности — слишком четкое выражение мыслей, лишенное чувств.

Высокий и звонкий
Голос вызывает ассоциации с энергичностью и юностью, а также с неопытностью и незрелостью. Чем голос выше, тем должность ниже - свидетельствует статистика. Высокие и пронзительные звуки воспринимаются подсознанием, как тревожный сигнал. Поэтому собеседники звонко говорящей личности испытывают дискомфорт, что непроизвольно уменьшает уровень доверия к словам.

Безразличный голос
Если речь вашего собеседника ровная и безразличная, видимо, ему неинтересна беседа, либо он в депрессии, тревоге или скучает. Еще такая манера может говорить о затаенных сильных чувствах: обиде, ревности, ненависти, зависти и др.

Голос с претензией
Напыщенность и претенциозность обусловлены разными причинами. Это может быть неуверенность, жажда одобрения и признания другими людьми успешности, ума и других качеств или неуважительное и высокомерное отношение к окружающим.

Голос с придыханием
Обычно дыхание собеседника в разговоре не слышится, но если это происходит, то причинами могут быть сексуальный интерес, сильное волнение, нервозность, стресс или недоверие, которое часто сопровождается покачиваниями головы и другими жестами.

Низкий голос
Вызывает ассоциации с уверенностью, самодостаточностью, интеллектом. Обладателя интуитивно воспринимают, как авторитетного и знающего. Чем ниже голос у мужчины, тем надежней и сильнее его считает женщина.

Низкий голос обусловлен высоким уровнем мужских гормонов в крови, что подразумевает более яркий темперамент. По этой причине обладательница низкого грудного голоса, кажется более сексуальной, чем женщина, говорящая звонко.

Тихий голос
Тихий голос может говорить о противоположных качествах обладателя, поэтому никогда не стоит спешить с выводами. Тихая речь наводит мысль на то, что человек застенчив и неуверен в себе, занимает позицию созерцателя жизни, а не творца.

Голос может выступать, как предатель, если не умееть управлять им. Он расскажет всю подноготную, — от болезней, перенесенных в детстве до сиюминутных переживаний. Психологи, к примеру, по голосу могут определить, являетесь ли человек потенциальным алкоголиком, что для него важнее — семья или карьера.

Голос может быть и союзником. С его помощью производить желаемое впечатление, манипулировать людьми и добиваться тем самым своих целей. Каким бы ни был ваш голос, давайте ему волю чаще: пойте под караоке или застольные песни с друзьями, кричите или аукайте на природе.

Возьмите за правило распевать или хотя бы мурлыкать под нос себе любую мелодию. Выплескивайте эмоции без остатка, когда это возможно: смейтесь, а не хихикайте, рыдайте, не сдерживая слезы. Позволяйте себе звучать. Это очень полезно и помогает достичь гармонии с окружающим миром и с самим собой.