Diftong je zvláštním typem hlásek s tónovou strukturou. Zatímco formantová charakteristika vokálu je v jeho průběhu celkem stálá, v diftongu dochází k plynulé proměně struktury.
Fonetická literatura připomíná dva typy dvojhlásek: Pravé diftongy, v nichž si obě složky zachovávají plnou vokaličnost (tento typ je velmi vzácný) a diftongy nepravé, v nichž si plnou vokalickou stavbu uchovává jen část, zatímco druhá složka ji částečně ztrácí, mění se na polosamohlásku. Podle postavení této oslabené složky se nepravé diftongy dělí na stoupavé, v nichž je oslabená složka počátkem diftongu (např. slovenské diftongy jsou stoupavé – mlieko – [mlɩeko], kôň – [kʋoň]), a klesavé, v nichž je oslabená část na konci (např. české [oʋ] (= psané ou). Termínem diftong se, pokud není jinak uvedeno, rozumí v literatuře obvykle diftong nepravý. Specifikum tónového průběhu diftongu, ev. složitějších vokalických zvuků (triftongů, polyftongů) odpovídá proměnlivosti jeho artikulace (5.3). Zvukový průběh odráží výše spektrogram výrazu [koʋboʋ]. Lze pak odlišit i diftong polohový, jehož fáze jsou relativně vymezitelné (např. české [oʋ] = ‚ou‘), a pohybový, kde jde o tendenci proměny zvuku,
V některých jazycích diftongy neexistují (např. v ruštině), v jiných jazycích mohou existovat i složitější kombinace vokalických a klouzavých prvků (např. v nám blízké slovenštině – dievča [ɟieʋʧa].
Proměny zvuku vokálu mohou vznikat v některých jazycích i při obměnách jejich tvoření v závislosti na artikulační bázi jazyka nebo na hláskovém okolí. V ruštině se např. vyslovuje po retnicích [o] s nádechem [u], podobně se tu vyslovuje [o] i na počátku slova. Taková výslovnost se označuje jako diftongoidní (podle Ščerby).