Englisch mit KI-Tutoren üben — 3 Tage kostenlos

Echte Gespräche. Rund um die Uhr verfügbar. Jederzeit kündbar.

Alle 20 englischen Vokallaute aussprechen lernen

Practiceme·
englische VokaleVokale im EnglischenAussprache englischer Vokalealle englischen Vokallautelange und kurze Vokale im Englischenenglische Vokaltabelle
Alle 20 englischen Vokallaute aussprechen lernen

Im Englischen gibt es fünf Vokalbuchstaben. Aber rund zwanzig englische Vokallaute. Das ganze Problem in einem Satz.

Wenn du dich jemals gefragt hast, warum „ship" und „sheep" aus deinem Mund gleich klingen oder warum dein „cat" als „cut" missverstanden wird – das sind keine Zufallsfehler. Du stößt auf die Lücke zwischen englischer Schreibweise und englischer Aussprache – eine Lücke, durch die die meisten Lernenden nie richtig hindurchgeführt werden.

Kurz zusammengefasst: Englische Vokallaute sind insgesamt rund 20 – 12 Monophthonge (einzelne, gleichbleibende Vokale) und 8 Diphthonge (gleitende Vokale) – obwohl das geschriebene Alphabet nur 5 Vokalbuchstaben hat. Dieser Guide schlüsselt jeden Vokal mit IPA-Symbolen, Mundstellungs-Hinweisen, Minimalpaar-Übungen und L1-spezifischen Tipps für Spanisch-, Chinesisch- und Japanisch-Sprecher auf.

Das ist die komplette Karte der englischen Vokale. Am Ende weißt du, welcher Laut welcher ist, wie dein Mund ihn formt, wo deine Muttersprache dir Steine in den Weg legt und wie du jeden einzelnen so lange übst, bis deine Aussprache dem entspricht, was du im Kopf hörst.

Die 20 englischen Vokallaute auf einen Blick

Englisch hat 5 geschriebene Vokale: A, E, I, O, U. Gesprochen sind es rund 20 Vokallaute. Die genaue Zahl hängt vom Akzent ab – General American verwendet typischerweise etwa 15, Received Pronunciation (britisches Englisch) etwa 20, wenn man die zentrierenden Diphthonge mitzählt – aber der ESL-Standard lehrt 20 Vokalphoneme, weil das beide großen Akzente abdeckt.

Diese 20 teilen sich in zwei Gruppen:

  • 12 Monophthonge – einzelne, gleichbleibende Vokallaute, bei denen dein Mund eine Position hält
  • 8 Diphthonge – gleitende Laute, die innerhalb einer Silbe von einer Vokalposition zur nächsten wechseln

Hier ist die komplette Übersichtstabelle. Lies sie einmal durch, dann gehen wir jede Gruppe im Detail durch. Wenn du nachschlagen willst, hat die offizielle IPA-Vokaltabelle auf Wikipedia Audiobeispiele zu jedem hier verwendeten Symbol.

Die 12 Monophthonge

IPATypBeispielKlingt wie
/iː/langsheep„ie"
/ɪ/kurzship„i" (kurz)
/e/ oder /ɛ/kurzbed„e"
/æ/kurzcat„ä" (Mund breit)
/ʌ/kurzcup„a" (betont, entspannt)
/ɑː/langcar, father„a" (Mund weit offen)
/ɒ/kurz (britisch)hot„o" (gerundet, kurz)
/ɔː/langthought„o" (offen, lang)
/ʊ/kurzput„u" (kurz)
/uː/langboot„u" (lang)
/ɜː/langbird„ö"-ähnlich
/ə/kurzabout„e/a" (unbetont, Schwa)

Die 8 Diphthonge

IPABeispielGleitet von → nach
/eɪ/face/e/ → /ɪ/
/aɪ/price/a/ → /ɪ/
/ɔɪ/boy/ɔ/ → /ɪ/
/aʊ/mouth/a/ → /ʊ/
/əʊ/ (UK) oder /oʊ/ (US)go/ə/ oder /o/ → /ʊ/
/ɪə/near/ɪ/ → /ə/
/eə/square/e/ → /ə/
/ʊə/tour/ʊ/ → /ə/

Ein paar wichtige Hinweise:

  • Schrägstriche wie /iː/ bedeuten, dass wir vom Laut sprechen, nicht vom Buchstaben. Das ist die Standard-IPA-Notation.
  • Der Doppelpunkt (ː) hinter einem Vokal wie /iː/ zeigt, dass der Laut lang ist. Die Länge allein ist nicht die ganze Geschichte (dazu kommen wir gleich), aber der Doppelpunkt sagt Wörterbüchern, dass du ihn länger hältst als die kurze Variante.
  • Amerikanisch vs. britisch: /ɒ/ (britisches „hot") fällt im amerikanischen Englisch meist mit /ɑː/ zusammen („hot" reimt sich auf „cot"). Die drei zentrierenden Diphthonge (/ɪə/, /eə/, /ʊə/) sind vor allem britisch – Amerikaner sprechen sie meist als Vokal plus R-Laut aus.

Das ist das Inventar der englischen Vokale. Jetzt schauen wir uns die physische Maschine an, die sie produziert.

Die englische Vokaltabelle: Wie dein Mund jeden Laut formt

Raster aus Makrofotos, das sechs verschiedene Lippen- und Mundstellungen zeigt, mit denen die englischen Vokallaute geformt werden

Ein Vokal ist einfach ein Laut, der mit offenem Vokaltrakt erzeugt wird. Keine Zähne, die zubeißen, keine Lippen, die sich schließen, keine Zunge, die den Luftstrom blockiert. Luft strömt aus, deine Stimmbänder schwingen, und die Form deines Mundes filtert diesen Klang zu einem bestimmten Vokal.

Drei physische Variablen entscheiden, welcher Vokal herauskommt:

1. Zungenhöhe – wie hoch oder tief deine Zunge im Mund sitzt

  • Hoch (geschlossen): /iː/ wie in „see", /uː/ wie in „boot"
  • Mittel: /e/ wie in „bed", /ɜː/ wie in „bird"
  • Tief (offen): /æ/ wie in „cat", /ɑː/ wie in „car"

2. Zungenlage (vorne/hinten) – ob deine Zunge im vorderen, mittleren oder hinteren Mundbereich gebündelt ist

  • Vorne: /iː/, /ɪ/, /e/, /æ/
  • Mittig: /ʌ/, /ɜː/, /ə/
  • Hinten: /uː/, /ʊ/, /ɔː/, /ɑː/, /ɒ/

3. Lippenrundung – sind deine Lippen zu einem „O" gerundet oder gespreizt/neutral?

  • Gerundet: /uː/, /ʊ/, /ɔː/, /ɒ/ (im Grunde alle hinteren Vokale außer /ɑː/)
  • Ungerundet: /iː/, /ɪ/, /e/, /æ/, /ʌ/, /ɜː/, /ə/, /ɑː/

Phonetiker tragen all das in ein Diagramm ein, das Vokalviereck genannt wird – ein Trapez, das deinen Mund von innen abbildet. Vordere Vokale links, hintere rechts. Hohe Vokale oben, tiefe unten. Wenn dir eine Vokaltabelle mit /iː/ oben links und /ɑː/ unten rechts begegnet – das ist der Grund.

Warum das fürs Üben wichtig ist

Die Mundstellung ist der am besten lehrbare Teil der Aussprache. Einen Laut kann man nicht sehen, aber du kannst spüren, wo deine Zunge gerade ist. Probier das gleich aus:

  • Sag „ee" (wie in „see"). Deine Zunge ist hoch und nach vorne geschoben. Die Lippen sind gespreizt.
  • Gleite langsam zu „ah" (wie in „car"). Deine Zunge fällt nach unten und zieht sich nach hinten. Die Lippen entspannen sich.
  • Gleite dann zu „oo" (wie in „boot"). Die Zunge geht wieder nach oben, bleibt aber hinten. Die Lippen spitzen sich zu einem engen Kreis.

Du hast gerade drei Ecken des Vokalvierecks abgefahren. Jeder andere englische Vokal sitzt irgendwo in diesem Dreieck.

Gespannt vs. ungespannt: Ein nützlicheres Konzept als „lang vs. kurz"

Linguisten bevorzugen heute oft gespannt vs. ungespannt gegenüber „lang vs. kurz". Warum? Weil der eigentliche Unterschied zwischen /iː/ (sheep) und /ɪ/ (ship) nicht nur die Länge ist. Sondern:

  • Gespannte Vokale (/iː/, /uː/, /eɪ/, /oʊ/, /ɑː/): mehr Muskelspannung in Zunge und Lippen, randständigere Position in der Tabelle, häufig länger.
  • Ungespannte Vokale (/ɪ/, /ʊ/, /e/, /æ/, /ʌ/, /ə/): Zunge entspannt, zentraler gelegen, kürzer.

Wenn du nur einen kurzen Vokal in die Länge ziehst, klingt er trotzdem nicht wie der lange. Du musst auch ändern, wo deine Zunge ist. Deshalb können Spanischsprecher den ganzen Tag „shiiiip" sagen, und es klingt trotzdem nicht wie „sheep".

Kurze und lange Vokale: Die Minimalpaare, die wirklich zählen

Overhead-Flatlay mit Wellenform-Vergleich zwischen kurzen und langen Vokallauten, daneben kontrastierende physische Objekte auf indigoblauem Hintergrund

Ein Minimalpaar sind zwei Wörter, die sich in genau einem Laut unterscheiden. Sie sind das schärfste Werkzeug fürs Hörtraining, weil sie den Kontrast isolieren, den du hören musst.

Fünf Vokalpaare verursachen etwa 80 % der Missverständnisse, die ESL-Lernende im Alltag haben. Drille diese, und deine Aussprache wird dramatisch klarer.

1. /ɪ/ vs. /iː/ – ship vs. sheep

  • /ɪ/ (ship): Mund leicht geöffnet, Zunge mittelhoch vorne, Lippen entspannt und leicht gespreizt. Kurz und ungespannt.
  • /iː/ (sheep): Mund fast geschlossen, Zunge hoch nach vorne geschoben, Lippen weit gespreizt (wie beim Lächeln). Lang und gespannt.

Paare: ship/sheep, bit/beat, fit/feet, slip/sleep, rich/reach, chip/cheap, live/leave, his/he's, filled/field, dim/deem.

2. /ʊ/ vs. /uː/ – pull vs. pool

  • /ʊ/ (pull): Zunge hoch hinten, Lippen leicht gerundet, aber locker. Kurz und ungespannt.
  • /uː/ (pool): Zunge hoch hinten, Lippen fest zu einem kleinen Kreis gerundet (wie beim Ausblasen einer Kerze). Lang und gespannt.

Paare: pull/pool, full/fool, look/Luke, soot/suit, should/shooed, could/cooed, wood/wooed, foot/food.

3. /e/ vs. /æ/ – bed vs. bad

  • /e/ (bed): Zunge mittig vorne, Mund leicht geöffnet.
  • /æ/ (bad): Lass den Kiefer weiter fallen, schiebe deine Zunge tiefer und breiter. Hier ist bewusste Kieferbewegung gefragt.

Paare: bed/bad, men/man, head/had, send/sand, pen/pan, lend/land, bet/bat, dead/dad, said/sad, end/and.

4. /ʌ/ vs. /ɑː/ – cup vs. cop

  • /ʌ/ (cup): Zunge mittig, Mund leicht geöffnet, Lippen neutral. Ein entspanntes „a".
  • /ɑː/ (cop, car): Mund weit offen, Zunge fällt nach unten und zieht sich zurück. Das „bitte weit aufmachen", das der Zahnarzt verlangt.

Paare: cup/cop, luck/lock, but/bot, gut/got, shut/shot, putt/pot, rub/rob, hut/hot, duck/dock, fund/fond.

5. /ɑː/ vs. /ɜː/ – fast vs. first

  • /ɑː/ (fast): Kiefer offen, Zunge hinten und tief. (Britischer „father"-Laut.)
  • /ɜː/ (first): Mund in neutraler Position, Zunge mittig und leicht gekrümmt oder gebündelt. (Der „er"-Laut.)

Paare: fast/first, bard/bird, far/fur, harm/herm, carve/curve, barn/burn, part/pert, palm/perm, starve/serve, dart/dirt.

Drille jedes Paar fünfmal im Wechsel: „ship – sheep – ship – sheep – ship." Dann pack sie in einen Satz: „I'll ship the sheep." Dein Ohr kalibriert sich innerhalb einer Woche. Für tiefergehende Übungen schau in unseren Guide zu englischen Minimalpaaren.

Der Schwa-Laut /ə/: Der wichtigste Vokal des Englischen

Der Schwa ist der häufigste Vokallaut im Englischen – er taucht in etwa jeder dritten Silbe auf, die du hörst. Er ist auch der Laut, den Nicht-Muttersprachler am stärksten unterbenutzen – weshalb sie oft „überdeutlich" klingen.

Der Schwa-Laut ist der Laut am Anfang von „about" (/əˈbaʊt/), in der Mitte von „banana" (/bəˈnænə/) und am Ende von „sofa" (/ˈsoʊfə/). Ein kurzes, lockeres, neutrales „a/e" ohne jede Muskelspannung.

Hier ist die Regel, die alles verändert: Englisch reduziert die meisten unbetonten Vokale zu einem Schwa, ganz egal, wie sie geschrieben sind.

  • „computer" ist nicht kom-PJU-ter, sondern /kəmˈpjuːtər/ – das erste „o" wird zum Schwa
  • „photograph" → „phoTOGraphy" – das zweite „o" wechselt von /ɒ/ zu /ə/, sobald sich die Betonung verschiebt
  • „the" wird beim schnellen Sprechen zu /ðə/, nicht zu /ðiː/

Wenn du jeden Vokal so aussprichst, wie er geschrieben steht, klingst du roboterhaft. Wenn du unbetonte Vokale zu Schwa reduzierst, klingst du natürlich.

We've got a full breakdown of schwa drills and stress patterns in our dedicated — including the most common spelling patterns that hide a schwa. For now, just know: the schwa isn't lazy English, it's correct English.

R-Vokale: Warum „bird", „her" und „turn" gleich klingen

Drei Papierstreifen mit den Buchstabenkombinationen ER, IR, UR, die auf ein zentrales rotes R zulaufen und so die R-Vokale im Englischen darstellen

Wenn ein R einem Vokal in derselben Silbe folgt, verhält es sich nicht wie ein normaler Konsonant – es verformt den Vokal selbst. Das Ergebnis ist eine Kategorie namens R-Vokale (oder „rhotische Vokale"), und sie verwirren fast alle, die Englisch als Zweitsprache lernen.

Hier die fünf Muster mit Lauten und Beispielwörtern:

AR /ɑːr/ (Amerikanisch) oder /ɑː/ (Britisch)

  • Beispiele: car, park, start, farm, heart, garden, hard, arm, sharp, dark
  • Mund offen, Zunge hinten und tief, dann R-Krümmung (Amerikanisch) oder einfach Vokal verlängern (Britisch)

OR /ɔːr/ (Amerikanisch) oder /ɔː/ (Britisch)

  • Beispiele: for, born, short, north, door, four, horse, morning, store, score
  • Lippen rund zu einem kleinen „o", dann R-Gleiter

ER /ɜːr/ (Amerikanisch) oder /ɜː/ (Britisch)

  • Beispiele: her, verb, term, perfect, mercy, person, modern, clerk, fern, herd

IR /ɜːr/ – identisch zu ER

  • Beispiele: bird, first, girl, shirt, third, firm, dirt, birthday, stir, circle

UR /ɜːr/ – identisch zu ER und IR

  • Beispiele: turn, burn, curl, hurt, nurse, church, purple, return, purpose, surface

Die entscheidende Erkenntnis

ER, IR und UR ergeben alle denselben Laut: /ɜːr/. Die Schreibweisen sind historische Zufälle aus dem Mittelenglischen. Dein Mund formt für den Vokal in „her", „bird" und „turn" exakt die gleiche Position. Wenn du einen aussprechen kannst, kannst du alle drei.

Amerikanische vs. britische R-Vokale

Hier driften die Akzente stark auseinander:

  • Amerikanisches Englisch ist rhotisch: Das R wird in „car" /kɑːr/ voll ausgesprochen. Deine Zunge krümmt sich nach oben oder bündelt sich nach hinten.
  • Britisches RP ist nicht-rhotisch: Das R verschwindet nach einem Vokal. „Car" wird zu /kɑː/ – nur ein langer, offener Vokal, gar kein R-Laut.

If you want to sound American, lock in the R. If you want British RP, drop the R after vowels and lengthen the preceding vowel instead. Both are correct; just pick one and be consistent. For deeper coverage of the R sound itself, see our guide on .

Diphthonge: Wenn ein Vokal in den nächsten gleitet

Ein Diphthong ist ein einzelner Vokallaut, bei dem deine Zunge in einer Position startet und sanft in eine andere gleitet – alles in einer Silbe. Es ist ein Laut, nicht zwei – auch wenn er mit zwei IPA-Symbolen geschrieben wird.

Stell dir „boy" /bɔɪ/ vor. Dein Mund startet in einer „o"-Form (/ɔ/) und gleitet hoch zu „i" (/ɪ/). Eine flüssige Bewegung. Eine Silbe. Ein Vokallaut.

Die 8 englischen Diphthonge

1. /eɪ/ wie in face

  • Wörter: face, day, eight, weight, break, name, train
  • Gleitet: startet bei /e/ (bed), gleitet zu /ɪ/ (ship)

2. /aɪ/ wie in price

  • Wörter: price, eye, my, time, light, five, kite
  • Gleitet: startet bei /a/ (offen), gleitet zu /ɪ/

3. /ɔɪ/ wie in boy

  • Wörter: boy, coin, voice, join, oil, employ
  • Gleitet: startet bei /ɔ/ (gerundet hinten), gleitet zu /ɪ/

4. /aʊ/ wie in mouth

  • Wörter: mouth, now, how, town, sound, brown, cloud
  • Gleitet: startet bei /a/, gleitet zu /ʊ/ (gerundet)

5. /oʊ/ (Amerikanisch) oder /əʊ/ (Britisch) wie in go

  • Wörter: go, home, boat, slow, road, show, phone
  • Gleitet: startet bei /o/ oder /ə/, gleitet zu /ʊ/

6. /ɪə/ wie in near (hauptsächlich britisch)

  • Wörter: near, ear, here, year, beer, deer, idea
  • Im amerikanischen Englisch meist als /ɪr/ ausgesprochen

7. /eə/ wie in square (hauptsächlich britisch)

  • Wörter: square, hair, care, where, air, share
  • Im amerikanischen Englisch meist als /er/ oder /ɛr/ ausgesprochen

8. /ʊə/ wie in tour (hauptsächlich britisch)

  • Wörter: tour, pure, sure, cure, mature
  • Im amerikanischen Englisch meist /ʊr/ oder zu /ɔr/ verschoben

Der häufigste Diphthong-Fehler

ESL-Lernende sprechen Diphthonge oft als zwei getrennte Vokale aus statt als einen flüssigen Gleitlaut. „Day" wird zu „de-i" statt /deɪ/. „Boy" wird zu „bo-i" statt /bɔɪ/.

Die Lösung: Leg dein ganzes Gewicht auf den ersten Vokal (etwa 80 % der Dauer), dann lass deinen Mund schnell in den zweiten gleiten. Mach keine Pause dazwischen. Es soll sich wie eine durchgehende Bewegung anfühlen, nicht wie zwei Schläge.

Häufige Vokalfehler nach Muttersprache

Overhead-Ansicht von Sprachlern-Notizbüchern mit spanischer, chinesischer und japanischer Handschrift, die die Aussprache-Hürden verschiedener Muttersprachen abbilden

Deine Muttersprache ist der größte Einzelfaktor dafür, welche englischen Vokale dir Probleme machen. Jede Sprache hat ein festes Inventar an Lauten, und dein Gehirn hat jahrelang Sprache durch diesen Filter kategorisiert. Wenn Englisch einen Laut verwendet, den deine L1 nicht hat, versucht dein Gehirn, ihn dem nächstbesten Nachbarn zuzuordnen – auch wenn es keinen guten Treffer gibt.

So sieht das für drei der häufigsten L1-Hintergründe aus.

Spanisch-Sprecher: 5 Vokale auf 20 abgebildet

Spanisch hat genau 5 Vokallaute: /a/, /e/, /i/, /o/, /u/. Sie sind rein (kein diphthongartiges Gleiten), bleiben in jeder Position gleich und werden nie zu einem Schwa reduziert. Schön, vorhersagbar, einfach.

Englisch verlangt von dir, von 5 Kategorien auf 20 zu erweitern. Vorhersehbares Ergebnis: Kollaps.

Die klassischen Vokalfehler spanischsprachiger Lernender:

  • /ɪ/ ↔ /iː/ verschmelzen: „ship" und „sheep" werden beide zu /ʃip/ – nahe am spanischen /i/. Übung: ship/sheep, bit/beat, sit/seat.
  • /æ/ wird als /e/ ausgesprochen: „cat" wird zu „ket", „bad" zu „bed". Spanisch hat kein tiefes vorderes /æ/ – dein Kiefer muss weiter fallen, als sich natürlich anfühlt.
  • /ʌ/ wird als /a/ oder /o/ ausgesprochen: „cup" wird zu „cop" oder „cap". Das englische zentrale /ʌ/ existiert im Spanischen nicht – übe es als entspannte, neutrale Mundform.
  • Kein Schwa: Spanisch gibt jedem Vokal seinen vollen Wert, deshalb wird „banana" zu /baˈnana/ statt /bəˈnænə/. Das ist die wichtigste Korrektur: lerne, unbetonte Vokale zu reduzieren.
  • Diphthonge spalten sich in zwei Vokale: „day" wird zu /ˈde.i/ in zwei Silben statt /deɪ/ in einer.

Priorisierte Übungen für Spanisch-Sprecher: /ɪ/ vs. /iː/, /æ/ vs. /e/, /ʌ/ vs. /ɑː/ und Schwa-Reduktion. Mehr dazu in unserem Beitrag zu schwierigen englischen Wörtern für Spanisch-Sprecher.

Chinesisch (Mandarin)-Sprecher: Vokalreduktion ist das eigentliche Problem

Mandarin hat ein kleineres Vokalinventar als Englisch (rund 6–7 Monophthonge, je nach Analyse) und unterscheidet Bedeutung über Töne statt über Betonung. Weil Mandarin jeder Silbe etwa gleich viel Gewicht gibt, übertragen Muttersprachler dieses Muster oft auf Englisch – und lassen jede Silbe gleich prominent klingen.

Das Ergebnis ist ein „abgehacktes" Englisch, in dem jeder Vokal voll artikuliert wird und der natürliche Rhythmus aus betonten und unbetonten Silben verloren geht.

Typische Vokalfehler von Mandarin-Sprechern:

  • Kein Schwa: Das ist das Hauptproblem. „Photograph" /ˈfoʊtəɡræf/ → photoGRAPH mit jedem Vokal voll ausgesprochen. Schwa-Reduktion zu lernen ist das größte Aussprache-Upgrade.
  • /ɪ/ vs. /iː/-Verwechslung: Mandarin /i/ liegt dazwischen. Übe den Kontrast aus Lippen-Spreizen und hoher Zunge.
  • /æ/ existiert nicht: Wird oft durch /ɛ/ („cat" → „ket") oder /a/ („cat" → „kaht") ersetzt. Ein bewusster Kieferfall hilft.
  • /ʌ/-Annäherung: Klingt oft eher wie /a/. Ziele auf eine zentrale, entspannte Mundstellung.
  • Diphthong-Reduktion: Mandarin hat zwar einige Diphthonge, aber sie sind kürzer; englische Diphthonge brauchen einen längeren ersten Vokal und ein deutliches Gleiten.

Priorisierte Übungen für Mandarin-Sprecher: Schwa-Reduktion, /ɪ/ vs. /iː/, /æ/ und der Kontrast aus betonter und unbetonter Silbe in Wörtern wie photograph/photography/photographic.

Japanisch-Sprecher: Länge, Schwa und eingeschobene Vokale

Japanisch hat 5 Vokale: /a/, /i/, /u/, /e/, /o/. Und jetzt kommt der Twist: Im Japanischen ist die Vokallänge phonemisch, das heißt, kurz vs. lang kann die Wortbedeutung ändern (z. B. „kite" /kite/ „kommen" vs. „kiite" /kiːte/ „hörend"). Japanisch-Sprecher verstehen also bereits das Prinzip der Vokallänge.

Aber englische Vokallänge ist mit der Vokal-Qualität (Zungenposition) verknüpft – und genau da wird es schwierig.

Typische Vokalfehler von Japanisch-Sprechern:

  • Vokale nach Konsonanten anhängen: Japanische Silben enden fast immer auf einen Vokal, deshalb bekommen englische Konsonantencluster und konsonantfinale Wörter zusätzliche Vokale. „Strike" wird zu „su-to-rai-ku". Arbeite an wortfinalen Konsonanten ohne nachgeschobenen Vokal.
  • /æ/ existiert nicht: Wird durch /a/ ersetzt. Die Lösung ist dieselbe wie bei anderen Lernenden – Kiefer fallen lassen, Mund breiter ziehen.
  • Der STIR-Vokal /ɜːr/ ist brutal: Japanisch hat keine R-gefärbten Vokale, und das /ɜːr/ in „bird, her, turn, work, world" verlangt sowohl eine unbekannte Zungenposition als auch den rhotischen Gleiter.
  • Längenübertragung fühlt sich zu kurz an: Japanische Langvokale sind etwa 1,5-mal so lang wie kurze. Englisch /iː/ vs. /ɪ/ hat eher den Faktor 2 plus den Qualitätswechsel. Verlängere stärker, als sich natürlich anfühlt.
  • Kein Schwa: Wie bei anderen Sprachen wird jeder Vokal voll ausgesprochen. Aktive Reduktionsübungen sind unverzichtbar.

Priorisierte Übungen für Japanisch-Sprecher: /ɜːr/-Wörter (bird, her, turn, learn, work, world), wortfinale Konsonanten ohne Vokal, /æ/-Kieferfall sowie Länge plus Qualität von /iː/ vs. /ɪ/. Unser ausführlicher Beitrag zu den schwersten englischen Wörtern sortiert nach L1 hat noch spezifischere Wortübungen.

30 Übungswörter: Jeden Vokallaut drillen

Persönliches Lernheft mit handschriftlich notierten englischen Übungswörtern in Spalten mit Strichlisten unter warmem Schreibtischlampen-Licht

Hier sind 30 hochfrequente englische Wörter, sortiert nach Vokallaut. Such dir pro Einheit 5–6 Laute aus und drille sie – sprich jedes Wort dreimal hintereinander aus, dann pack es in einen kurzen Satz.

/iː/ wie in sheep

  1. see – „I see it."
  2. need – „I need help."
  3. green – „It's green."
  4. week – „Next week."
  5. machine – „Use the machine."

/ɪ/ wie in ship

  1. big – „It's big."
  2. little – „A little bit."
  3. interesting – „That's interesting."
  4. finish – „Did you finish?"
  5. business – „Open for business."

/æ/ wie in cat

  1. happy – „I'm happy."
  2. family – „My family."
  3. answer – „The answer is no."
  4. bank – „Go to the bank."
  5. bag – „In the bag."

/ʌ/ wie in cup

  1. money – „I have no money."
  2. love – „I love it."
  3. enough – „That's enough."
  4. country – „What country?"
  5. brother – „My brother."

/ɜːr/ wie in bird

  1. work – „I have to work."
  2. first – „Me first."
  3. early – „Wake up early."
  4. person – „Nice person."
  5. return – „I'll return tomorrow."

/eɪ/ wie in face

  1. today – „Not today."
  2. wait – „Please wait."
  3. make – „Make it."
  4. email – „Send the email."
  5. change – „I need change."

Für jedes Wort solltest du: (1) es dreimal alleine aussprechen, (2) dich aufnehmen, (3) mit einer Audioaufnahme eines Muttersprachlers vergleichen und (4) es in einen Satz packen und im Gespräch verwenden. Beim letzten Schritt hören die meisten Lernenden auf – dabei passiert dort die eigentliche Verbesserung. Die Aussprache-Bibliothek von BBC Learning English ist eine gute kostenlose Quelle für native Audios, falls du eine Referenz brauchst.

Wie du übst: Die Audio-Shadowing-Methode für Vokale

IPA-Tabellen lesen wird deinen Akzent nicht reparieren. Mundmuskeln schon. Die mit Abstand wirksamste Technik, um neue englische Vokallaute zu verankern, ist Audio-Shadowing.

Shadowing heißt: parallel zu einer Audioaufnahme eines Muttersprachlers sprechen, nicht danach. Du startest einen Clip – ein kurzes Interview, eine Podcast-Minute, eine Filmszene – und sprichst die gleichen Wörter gleichzeitig mit dem Sprecher, im selben Rhythmus, Tonfall und mit derselben Vokalqualität in Echtzeit.

Warum Shadowing bei Vokalen funktioniert

Wenn du nach dem Audio nachsprichst, hat dein Gehirn Zeit, in deine alten Vokalkategorien zurückzufallen. Wenn du gleichzeitig mit dem Audio sprichst, fehlt dieser Puffer. Dein Mund muss körperlich genau das nachmachen, was der Muttersprachler in diesem Moment tut. Nach genug Wiederholungen werden die neuen Mundpositionen automatisch.

Drei wissenschaftlich gestützte Gründe, warum Shadowing gewinnt:

  1. Echtzeit-Motorimitation trainiert genau das Muskelgedächtnis, das Muttersprachler nutzen.
  2. Erzwungene Rhythmusanpassung zieht dein Betonungs-Muster Richtung englische Standardrhythmen.
  3. Keine Zeit zum Übersetzen hindert dich daran, Englisch durch deine L1 zu „lesen".

Die 15-Minuten-Vokal-Shadowing-Routine

Wähle einen Vokallaut pro Einheit.

Minute 0–2: Kalt zuhören. Spiele deinen Audioclip (30 Sekunden bis 2 Minuten). Sprich nicht mit. Hör nur zu und merke dir, wo dein Ziellaut vorkommt.

Minute 2–5: Mit Text shadowen. Lies mit, während das Audio läuft. Passe Tempo und Rhythmus an. Achte auf deinen Ziellaut.

Minute 5–10: Ohne Text shadowen. Hör nur zu und sprich mit. Mach dir keine Sorgen, jedes Wort zu erwischen – orientiere dich am Fluss.

Minute 10–13: Dich selbst aufnehmen. Shadowe noch einmal und nimm dich dabei auf. Dann hör dich an: Wo weicht dein Vokal vom Muttersprachler ab?

Minute 13–15: Gezielter zweiter Anlauf. Spiele die Stellen, an denen du abgewichen bist, noch einmal. Wiederhole sie in Schleife, bis deine Version passt.

Fünf Tage pro Woche, ein Vokallaut pro Einheit – und in etwa einem Monat hast du alle 20 englischen Vokallaute abgedeckt. Mehr Shadowing-Routinen findest du in unserem Guide zu englischen Shadowing-Übungen.

Wie dir Practice Me hilft, Vokallaute in echten Gesprächen zu fixen

Junger Mann mit kabellosen Earbuds, der laut Englisch-Konversation in einer gemütlichen Leseecke bei warmem Lampenlicht übt

Drills und Shadowing bauen die rohen Mundbewegungen auf. Aber hier kommt die harte Wahrheit, die die meisten Aussprachekurse verschweigen: Isolierte Drills übertragen sich nicht aufs echte Sprechen.

Du kannst „ship" vs. „sheep" vor dem Spiegel perfekt drillen. Sobald du in einem echten Gespräch bist – während du überlegst, was du sagst, dem anderen zuhörst und Blickkontakt hältst – kippen deine alten Vokalgewohnheiten zurück. Dein Gehirn hat zu viel anderes im Kopf, und die Aussprache rutscht ans Ende der Prioritätenliste.

Die Lösung ist die gleiche, mit der Sportler unter Wettkampfbedingungen trainieren: die Fähigkeit unter realistischen Bedingungen wiederholt üben, bis die neue Gewohnheit auch unter kognitiver Last hält.

Genau dafür ist gebaut.

Wie Practice Me Vokale im Kontext trainiert

  • Echtzeit-Sprachgespräche mit KI-Tutoren. Keine vorab aufgenommenen Drills. Du sprichst tatsächlich, die KI hört zu und antwortet. Vokale werden in dieser Art unvorbereitetem Austausch entweder gefestigt oder zerlegt.
  • Amerikanische und britische Akzent-Optionen. Die Tutoren Sarah und Marcus sprechen mit nativem amerikanischem Akzent; Oliver spricht mit nativem britischem Akzent. Wähle das Modell, das zu deinem Ziel passt – und achte auf den Unterschied /ɒ/ vs. /ɑː/, das rhotische vs. nicht-rhotische R, die Diphthong-Formen.
  • Sitzungsübergreifendes Gedächtnis. Dein KI-Tutor erinnert sich daran, worüber ihr gestern gesprochen habt, was du schon geübt hast und wo du dich verbessert hast. Du fängst nicht in jedem Gespräch bei null an.
  • Themen-Starter. Wenn dir nichts einfällt, wähl ein Szenario – Bewerbungsgespräch, Kaffee bestellen, ein Thema debattieren. So nutzt du die geübten Vokale ganz natürlich in realistischen Sätzen.
  • 24/7, ohne Urteil. Vokalfehler bringen dir hier keine genervten Seufzer ein. Du kannst denselben Satz zehnmal wiederholen, um das /ɜːr/ in „world" zu treffen, und der Tutor zieht einfach mit.

Was es vom Shadowing unterscheidet

Shadowing kopiert, was jemand anderes sagt. Practice Me bringt dich dazu, Sprache als Antwort auf unvorhersehbare Fragen zu erzeugen – und genau das ist die kognitive Herausforderung echter Gespräche. Deine Vokale müssen halten, während du gleichzeitig über Grammatik, Vokabeln und Bedeutung nachdenkst.

Practice Me startet mit einer 3-tägigen kostenlosen Testphase (keine Kreditkarten-Falle – jederzeit kündbar). Danach kostet es $19/Monat, oder du sparst 57 % im Jahresplan. Siehe Preisdetails.

Du brauchst keinen Lehrer, um englische Vokale zu lernen. Du brauchst konsistente, kontextbasierte Übung mit Feedback. Genau das hat bisher gefehlt – bis jetzt.

Dein 4-Wochen-Plan zur Vokal-Meisterung

Zwanzig englische Vokallaute sind viel. So verteilst du die Arbeit, damit sie wirklich sitzt.

Woche 1: Die 12 Monophthonge

  • Tag 1–2: /iː/ und /ɪ/ (Paar sheep/ship)
  • Tag 3–4: /e/ und /æ/ (Paar bed/bad)
  • Tag 5–6: /ʌ/, /ɑː/, /ɒ/ (Dreieck cup/cop/hot)
  • Tag 7: /ʊ/, /uː/, /ɔː/ (pull/pool/thought)

Tagesroutine: 10 Min. Minimalpaar-Drills + 15 Min. Gespräch in Practice Me mit den Ziel-Lauten der Woche.

Woche 2: Die 8 Diphthonge

  • Tag 1–2: /eɪ/ (face) und /aɪ/ (price) – die häufigsten
  • Tag 3–4: /ɔɪ/ (boy) und /aʊ/ (mouth) – Rückwärts-Gleiter
  • Tag 5: /oʊ/ (go) – der gerundete
  • Tag 6–7: /ɪə/, /eə/, /ʊə/ – zentrierende (überspringen, wenn du dich auf Amerikanisch konzentrierst)

Fokus: weiche Gleiter, keine zwei getrennten Vokale.

Woche 3: R-Vokale + Schwa

  • Tag 1–3: /ɜːr/ (bird/her/turn) – der einheitliche ER/IR/UR-Laut
  • Tag 4: /ɑːr/ (car/park)
  • Tag 5: /ɔːr/ (for/born)
  • Tag 6–7: Schwa-Reduktion – häufige mehrsilbige Wörter üben

Diese Woche kümmert sich um die Laute, die die meisten Lernenden ignorieren – aber gerade sie haben den größten Einfluss auf die Verständlichkeit.

Woche 4: Connected Speech & Konversation

Jetzt hast du jeden einzelnen Vokallaut gedrillt. In Woche 4 setzt du alles zusammen.

  • Tag 1–3: Übe Connected Speech im Englischen – Vokalreduktionen im schnellen Sprechen.
  • Tag 4–5: Englische Wortbetonungs-Regeln – wo deine Vokale stark werden und wo schwach.
  • Tag 6–7: Freies Gespräch in Practice Me – keine Drills, einfach reden. Achte darauf, welche Vokale sich noch holprig anfühlen – die kommen auf die Liste für den nächsten Monat.

Wie du Fortschritte misst

Nimm dich an Tag 1 dabei auf, wie du einen Absatz laut vorliest. Lies denselben Absatz an Tag 28 ein. Der Fortschritt wird dich überraschen. Die meisten Lernenden bemerken nach 2–3 Wochen konstanter Übung klar hörbare Verbesserungen.

Häufig gestellte Fragen

Wie viele Vokallaute gibt es im Englischen?

Englische Vokallaute sind insgesamt etwa 20, wobei die genaue Zahl vom Akzent abhängt. General American nutzt typischerweise rund 15 Vokalphoneme, britische Received Pronunciation etwa 20 (sie ergänzt drei zentrierende Diphthonge: /ɪə/, /eə/, /ʊə/). Der ESL-Lehrstandard deckt 20 Laute ab – 12 Monophthonge und 8 Diphthonge – weil das beide Hauptakzente abdeckt.

Was ist der Unterschied zwischen kurzen und langen Vokalen im Englischen?

Kurze Vokale (wie /ɪ/ in „ship") sind ungespannt, mit entspannter Zunge und zentralerer Zungenposition. Lange Vokale (wie /iː/ in „sheep") sind gespannt, mit extremerer Zungenposition und längerer Dauer. Die entscheidende Erkenntnis: Der Unterschied liegt nicht nur in der Länge – sondern auch in der Qualität. Einen kurzen Vokal zu dehnen macht daraus noch keinen langen. Du musst auch deine Mundform ändern.

Sind amerikanische und britische englische Vokale unterschiedlich?

Ja, in drei wesentlichen Punkten. (1) Britisches Englisch unterscheidet /ɒ/ (hot) von /ɑː/ (father); amerikanisches Englisch verschmilzt beide. (2) Britisches Englisch ist nicht-rhotisch – das R verschwindet nach Vokalen, der Vokal wird stattdessen verlängert (car → /kɑː/). Amerikanisches Englisch ist rhotisch – das R wird voll ausgesprochen (car → /kɑːr/). (3) Der „go"-Diphthong ist /əʊ/ im Britischen und /oʊ/ im Amerikanischen – leicht unterschiedliche Startpositionen.

Muss ich IPA lernen, um meine englischen Vokale zu verbessern?

Du musst nicht jedes Symbol auswendig lernen, aber wer die IPA für die 20 englischen Vokallaute kennt, hat ein präzises Vokabular dafür, was in seinem Mund passiert. Jedes Wörterbuch verwendet IPA, und Ausspracheguides setzen voraus, dass du zumindest die Grundlagen lesen kannst. Behandle es wie ein Nachschlagewerk, nicht wie einen Test – du nimmst es im Gebrauch auf.

Warum klingen alle englischen Vokale für mich gleich?

Weil dein Gehirn sie durch die Vokalkategorien deiner Muttersprache filtert. Wenn deine L1 5 Vokale hat, „rundet" dein Gehirn anfangs alle 20 englischen Vokallaute auf diese 5 Schubladen ab. Die Lösung ist gezieltes Hörtraining mit Minimalpaaren – Wortpaaren wie ship/sheep, die sich in genau einem Vokal unterscheiden. Nach ein paar Wochen fokussiertem Zuhören baut dein Gehirn neue Kategorien auf. Das ist gut belegt und funktioniert in jedem Alter.

Was ist der schwerste englische Vokallaut zum Lernen?

Es hängt von deiner L1 ab, aber ein paar Laute sind durch die Bank herausfordernd: /æ/ (cat) existiert in den meisten Sprachen nicht und verlangt einen bewussten Kieferfall. /ɜːr/ (bird, her, turn) kombiniert einen unbekannten Vokal mit dem R-Gleiter. Der Schwa /ə/ ist schwer – nicht wegen des Lauts selbst, sondern weil du die Gewohnheit verlernen musst, jeden Vokal voll auszusprechen. Für Spanisch-Sprecher ist /ɪ/ vs. /iː/ die Hauptbaustelle. Für Japanisch-Sprecher stehen /ɜːr/ und /æ/ ganz oben. Für Mandarin-Sprecher ist die Schwa-Reduktion der Durchbruch.

Wie lange dauert es, englische Vokallaute zu meistern?

Die meisten Lernenden bemerken eine spürbare Verbesserung nach 2–3 Wochen täglicher, fokussierter Übung (15–30 Minuten pro Tag). „Meisterung" – also natürliche Produktion unter Gesprächsdruck – dauert typischerweise 3–6 Monate konstanter Arbeit. Die Variablen sind, wie stark sich dein L1-Vokalinventar vom Englischen unterscheidet, wie viel du täglich übst und ob du Feedback auf deine tatsächliche Sprache bekommst. Genau in die letzte Variable investieren die meisten Lernenden zu wenig.

Kann ich englische Vokale ohne Lehrer lernen?

Ja – und die meisten Lernenden tun das. Was du nicht brauchst, ist ein menschlicher Lehrer; was du brauchst, sind drei Dinge: (1) verlässliche Referenz-Audios zu jedem Vokal (kostenlos online), (2) Minimalpaar-Übungen, um dein Ohr zu trainieren (kostenlos oder per App), und (3) regelmäßiges Sprechen mit Feedback. Punkt drei ist der Flaschenhals. KI-Gesprächs-Apps wie Practice Me lösen das, indem du rund um die Uhr in unvorbereiteten Gesprächen sprechen kannst – ohne Urteil und mit unbegrenzten Versuchen – und das ist näher dran an dem, was echte Gespräche verlangen, als jedes Drillbuch es simulieren kann.

Fang an, Englisch mit klaren Vokalen zu sprechen

Die 20 englischen Vokallaute sind kein Gedächtnistest. Sie sind eine körperliche Fähigkeit. Du „lernst" sie nicht – du trainierst deinen Mund, sie zu produzieren.

Drei Dinge, die du dir merken solltest:

  1. Die Mundstellung ist lehrbar. Zungenhöhe, Zungenlage, Lippenrundung. Alles andere folgt daraus.
  2. Minimalpaare trainieren dein Ohr. Du kannst keinen Laut produzieren, den du nicht hörst.
  3. Vokale entscheiden sich im echten Gespräch. Drills sind das Aufwärmen. Echtes Sprechen ist das Spiel.

Wähle heute einen Vokal. Drille ihn 15 Minuten. Spring dann in ein Gespräch in und versuche, ihn zehnmal natürlich einzubauen. Morgen der nächste. Zwanzig Tage, zwanzig Laute, ein Akzent, den du wirklich beherrschst.

Deine 3-tägige kostenlose Testphase ist nur einen Tipp entfernt – ohne Karte, ohne Verpflichtung. Sprich Englisch so, wie du es in deinem Kopf sprichst: klar, selbstbewusst und ohne dass jemand deinen Weg dorthin beurteilt.

Sprechen Sie selbstbewusst Englisch

Üben Sie echte Gespräche mit KI-Tutoren rund um die Uhr. Keine Bewertung, kein Druck — einfach sprechen und besser werden.