En la membrana timpánica se fija el manubrio o mango del martillo, que está unido al yunque. El extremo opuesto del yunque se articula con la cabeza del estribo y la base de este último descansa sobre el laberinto membranoso de la cóclea en la abertura de la ventana oval. El extremo final del manubrio del martillo se fija al centro de la membrana timpánica y sobre este punto de inserción tira constantemente el músculo tensor del tímpano.

En las condiciones adecuadas, un diapasón o un vibrador electrónico colocado sobre cualquier protuberancia ósea del cráneo, cerca al oído, hace que la persona escuche el sonido. Pero, la energía que arrastra un sonido fuerte no basta para causar la audición a través de la conducción ósea, se necesita a un aparato electromecánico especial para la amplificación del sonido en el hueso.
La cóclea es un sistema de tres tubos en espiral:


La rampa vestibular y el conducto coclear están separados por la membrana de Reissner y la rampa timpánica y el conducto coclear están divididos por la membrana o lámina basilar, que contiene de 20.000 a 30.000 fibras basilares que se proyectan desde el centro óseo de la cóclea, el modíolo o columela, hacia su pared externa. La longitud de las fibras basilares aumenta progresivamente a partir de la ventana oval y su diámetro disminuye desde la ventana oval hacia la helicotrema. La resonancia de las frecuencias altas en la lámina basilar se produce cerca de su base, zona por donde penetran las ondas sonoras en la cóclea a través de la ventana oval. La resonancia de las frecuencias bajas sucede cerca del helicotrema.

Al desplazarse la base del estribo hacia dentro contra la ventana oval, la ventana redonda debe abombarse hacia fuera porque la cóclea se encuentra encerrada por todas partes por paredes óseas.
La tensión elástica acumulada en las fibras basilares a medida que se curvan hacia la ventana redonda provoca que una onda de líquido que viaje recorriendo la lámina basilar hacia la helicotrema. La onda de avance consiste en que se desplaza con rapidez a lo largo de la porción inicial de la lámina basilar, pero va frenando poco a poco a medida que avanza por la cóclea.
Cilios diminutos (estereocilios), llevan un sentido ascendente desde las células ciliadas y entran en contacto o quedan sumergidos en el revestimiento gelatinoso superficial de la membrana tectoria, que se halla por encima de los estereocilios en el conducto coclear. La inclinación de los cilios en un sentido despolariza las células ciliadas, y su inclinación en el sentido opuesto las hiperpolariza. El extremo externo de las células ciliadas está anclado a los pilares de Corti (una estructura rígida compuesta por una lámina plana).

Los sonidos de baja frecuencia dan lugar a una activación máxima de la lámina basilar cerca de la cúpula de la cóclea, y los de alta frecuencia lo hacen cerca de su base. El sistema nervioso utiliza un método fundamental para detectar las diversas frecuencias sonoras y consiste en determinar el punto más estimulado a lo largo de la lámina basilar, que se denomina principio de la posición para la determinación de la frecuencia sonora. Los sonidos de frecuencia grave, desde 20 hasta 1.500 a 2.000 ciclos/s, pueden provocar salvas de impulsos nerviosos sincronizados a la misma frecuencia, y estas salvas transmitirse por el nervio coclear hacia los núcleos cocleares del encéfalo. Un aumento de 10 veces en la energía del sonido se denomina 1 belio, y 0,1 belios reciben el nombre de 1 decibelio. Un decibelio representa un incremento real de 1,26 veces en la energía sonora. Un sonido de 3.000 ciclos/s puede oírse incluso cuando su intensidad sea tan solo de 70 decibelios por debajo de un nivel de presión sonora de 1 dina/cm2, lo que supone una diezmillonésima de microvatio por centímetro cuadrado.
Las fibras nerviosas procedentes del ganglio espiral de Corti penetran en los núcleos cocleares dorsal y ventral situados en la parte superior del bulbo raquídeo. La vía auditiva asciende a través del lemnisco lateral. Parte de las fibras acaban en el núcleo del lemnisco lateral, pero muchas otras se lo saltan y viajan hasta el colículo inferior, donde todas, o casi todas, las fibras auditivas realizan sinapsis. A partir de allí, la vía sigue hacia el núcleo geniculado medial, donde todas las fibras hacen sinapsis. Finalmente, la vía continúa por medio de la radiación auditiva hasta la corteza auditiva, que ocupa básicamente la circunvolución superior del lóbulo temporal. El sistema reticular de activación en el tronco del encéfalo, envía unas proyecciones difusas ascendentes por el tronco del encéfalo y descendentes hacia la médula espinal, y activa todo el sistema nervioso como respuesta a los sonidos fuertes.
La corteza auditiva se halla sobre todo en el plano supratemporal de la circunvolución temporal superior, se extiende hacia la cara lateral del lóbulo temporal, gran parte de la corteza de la ínsula e incluso la porción lateral del opérculo parietal.

La corteza auditiva primaria se excita directamente por las proyecciones procedentes del cuerpo geniculado media y las áreas auditivas de asociación se excitan por los impulsos de la propia corteza auditiva primaria además de algunas proyecciones originadas en las áreas talámicas de asociación adyacentes al cuerpo geniculado medial.
Para detectar la dirección de la que procede el sonido comienza en los núcleos olivares superiores del tronco del encéfalo. El núcleo olivar superior se divide en dos componentes:
1) el núcleo olivar superior medial
2) el núcleo olivar superior lateral
El núcleo lateral se ocupa de detectar la dirección de la que viene el sonido, posiblemente mediante la simple comparación entre la diferencia de las intensidades sonoras que llegan a ambos oídos y el envío de la señal correspondiente hacia la corteza auditiva para calcular la dirección.
Cuando surge un patrón espacial de estimulación neuronal en el núcleo olivar superior medial, en el que el sonido viene directamente desde un punto delante de la cabeza, provoca un estímulo máximo en una colección de neuronas olivares, y cuando llega formando diferentes ángulos laterales activa otros grupos de neuronas en lados opuestos.