Phoneme List

Since our goal is to detect mispronounced sounds in Qur’anic recitation, the model learns to recognize the sequence of pronounced phonemes and compare it to the target. We use the Nawar Halabi phonetizer for vowelized MSA (no tajweed rules) [1], which covers stress, pausing, intonation, emphaticness, diphones, and gemination. Geminated consonants are represented by doubling the symbol (e.g., /b/ → /bb/), yielding 68 phonemes in total.

Symbol letter Example IPA
a َ سَكَنٌ a
u ُ لَهُ ʊ
i ِ عَبْدِ ɪ
A َ emphatic أَسْقَطَ a
U ُ emphatic صُنْعِهُ ʊ
I ِ emphatic تَقِفُ ɪ
AA emphatic ا الْخُلْصَانِ a:
UU و emphatic تَقُولَ ʊ:
II يّ الْقِيُّ ɪ:
aa ا بِمَا a:
uu و دَعُونَا ʊ:
ii ي يُمْكِنُنِي ɪ:
< ء فَأَجْمِعُوا ʔ
<< ءّ ʔʔ
b ب الْبَارِحَةَ b
bb بّ رَبَّ bb
t ت رَأَيْته t
tt تّ حَتَّى tt
^ ث ثَرْوَةٍ θ
^^ ثّ ðð
j ج جَعَلْنَا ʒ
jj جّ الْفِجَّارِ ʒʒ
H ح حَسَنٍ ħ
HH حّ الصِّحَّةُ ħħ
x خ خَطَأٍ χ
xx خّ مُتَأَخِّرًا χχ
d د وَقَدْ d
dd دّ أَشْتَدَّ dd
* ذ ذَهَبَ ð
** ذّ ðð
r ر الْأَشْجَار r
rr رَّ اسْتَمَرَّ rr
z ز أَزْيَدُ z
zz زّ الزَّرْقَاءَ zz
s س لَيْسَ s
ss سّ السَّاخِنُ ss
$ ش شَمْسِيَّةٌ ʃ
$$ شّ وَمُمَشِّقُ ʃʃ
S ص صَدَفْتَ
SS صّ الصَّقْرِ sˤsˤ
D ض يَرْكُض
DD ضّ الْمُفَضَّلُ dˤdˤ
T ط أَسْخَطَ
TT طّ قَطُّ tˤtˤ
Z ظ نِظَارَةٌ
ZZ ظّ تُنَظِّفَ zˤzˤ
E ع عُنْوَانَكَ ʕ
EE عّ الْفَعَّالِيَّاتِ ʕʕ
g غ الْغِنَى ɣ
gg غّ الْمُصَغَّرَ ɣɣ
f ف لُطْف f
ff فّ التُّفَّاحَةِ ff
q ق حُقْبَةُ q
qq قّ تَلَقِّيهَا qq
k كَ كَانَ k
kk كِّ يُمَكِّنُنِي kk
l ل لَوْ ʟ
ll لّ الْلَّذِينَ ʟʟ
m م الْمَحَلِّ m
mm مّ عَمَّتِي mm
n ن لِأَبْنَائِهِ n
nn نّ إِنَّهَا nn
h ه أَقُولُهُ h
hh هّ الْجُهَّالَ hh
w و حَيَوانِ w
ww وّ الْجَوُّ ww
y يْ وَآتَيْنَاهُ ʝ
yy يّ أَيَّامٍ ʝʝ

References

  1. [1] N. Halabi and M. Wald, "Phonetic Inventory for an Arabic Speech Corpus," in *Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16)*, Portorož, Slovenia, May 2016, pp. 734-738. Available: https://aclanthology.org/L16-1116/