الذكاء الاصطناعي يزوّر الأصوات البشرية.. فكيف تحمي نفسك؟

الذكاء الاصطناعي يزوّر الأصوات البشرية.. فكيف تحمي نفسك؟
الجزيرة.نت - 5/27/2026 6:11:04 PM - GMT (+3 )

‹ ›

Published On 27/5/2026

لطالما اعتبر الصوت أحد أهم وسائل التحقق من الهوية البشرية، فعندما نتلقى اتصالا هاتفيا من أحد أفراد العائلة أو من مدير العمل أو من مسؤول نعرفه، فإننا نميل تلقائيا إلى الثقة بما نسمعه. لكن هذا الافتراض الذي استمر لعقود بدأ يتهاوى مع ظهور تقنيات استنساخ الأصوات والتزييف العميق المعتمدة على الذكاء الاصطناعي.

اليوم، لم يعد المحتال بحاجة إلى اختراق جهازك أو سرقة كلمة مرورك ليتمكن من خداعك، فبفضل أدوات الذكاء الاصطناعي الحديثة أصبح بإمكانه تقليد صوت شخص تعرفه بدقة كبيرة، وإقناعك بتحويل الأموال أو الكشف عن معلومات حساسة أو تنفيذ أوامر تبدو مشروعة تماما.

وقد دفعت هذه التطورات خبراء الأمن السيبراني والهيئات التنظيمية حول العالم إلى التحذير من موجة جديدة من الجرائم الرقمية تعتمد على استغلال الثقة البشرية أكثر من استغلال الثغرات التقنية.

المحتالون يعتمدون على تقنيات التزييف العميق الصوتي لانتحال شخصيات أفراد العائلة أو المسؤولين التنفيذيين لخداع الضحايا (شترستوك)

ما هو التزييف الصوتي العميق؟

التزييف الصوتي العميق هو استخدام تقنيات الذكاء الاصطناعي لإنشاء أو استنساخ أصوات بشرية تبدو حقيقية للغاية، وتعتمد هذه التقنية على نماذج التعلم العميق التي تُدرَّب على كميات ضخمة من البيانات الصوتية لتتعلم الخصائص الدقيقة للصوت البشري مثل النبرة والإيقاع وطريقة النطق والانفعالات.

ووفقا للجنة التجارة الفيدرالية الأمريكية (FTC)، فإن بعض أنظمة استنساخ الأصوات الحديثة تستطيع إنشاء نسخة مقنعة من صوت شخص ما باستخدام عينات قصيرة جدا من صوته منشورة على الإنترنت أو عبر وسائل التواصل الاجتماعي، وتؤكد اللجنة أن هذه التقنية أصبحت متاحة بشكل متزايد للجمهور والشركات والمطورين، مما يزيد من احتمالات إساءة استخدامها.

كيف تعمل تقنية استنساخ الأصوات؟

تمر عملية استنساخ الصوت عادة بعدة مراحل:

1. جمع البيانات الصوتية

يبدأ المهاجم بالحصول على تسجيلات صوتية للضحية المستهدفة. وقد تأتي هذه التسجيلات من مقاطع فيديو منشورة على منصات التواصل الاجتماعي، أو مقابلات إعلامية، أو رسائل صوتية مسجلة، أو اجتماعات افتراضية تم تسجيلها.

2. تدريب النموذج

يتم إدخال العينات الصوتية إلى نموذج ذكاء اصطناعي متخصص في استنساخ الأصوات، ويقوم النموذج بتحليل الخصائص الفريدة للصوت مثل درجة الصوت، وسرعة الكلام، واللهجة، وطريقة النطق، والأنماط العاطفية.

3. توليد الصوت المزيف

بعد انتهاء التدريب يستطيع النظام تحويل أي نص مكتوب إلى كلام يبدو وكأنه صادر عن الشخص المستهدف نفسه. وتشير أبحاث منشورة إلى أن جودة الأصوات الاصطناعية تطورت بشكل كبير خلال السنوات الأخيرة، وأصبحت بعض النماذج قادرة على إنتاج أصوات يصعب على المستمعين العاديين تمييزها عن الأصوات الحقيقية.

لم يعد الصوت وحده وسيلة موثوقة للتحقق من هوية المتحدث في عصر الذكاء الاصطناعي التوليدي (شترستوك)

معلومات وإحصائيات

تؤكد التقارير الصادرة عن كبرى الجهات الأمنية والبحثية أن خطر التزييف الصوتي يتصاعد بشكل مرعب، حيث يشير خبراء الأمن في شركة كاسبرسكي إلى أن أدوات التزييف العميق الصوتي أصبحت تباع كخدمة في أسواق الإنترنت المظلم بأسعار زهيدة لا تتعدى بضعة دولارات، مما جعل التكنولوجيا متوفرة للمحتالين الهواة وليس فقط للمجموعات المتقدمة.

كما أصدرت لجنة التجارة الفيدرالية الأمريكية (FTC)، تحذيرا رسميا شديد اللهجة للمستهلكين، مؤكدة أن شكاوى الاحتيال عبر انتحال الشخصيات تصدرت قائمة جرائم الاحتيال، حيث تجاوزت الخسائر المادية المليارات، ووصف رئيس اللجنة التزييف الصوتي بالذكاء الاصطناعي بأنه "السلاح الأكثر إقناعا في يد المجرمين اليوم".

كما وثقت مختبرات الأبحاث الأمنية العالمية حالات شهيرة خسرت فيها شركات مبالغ ضخمة، ولعل أبرزها حادثة قيام مدير بنك في إحدى الدول العربية بتحويل 35 مليون دولار في عام 2020 بعد تلقيه اتصالا هاتفيا بصوت مستنسخ بدقة لأحد مديري الشركات الكبرى التي يتعامل معها، وحادثة أخرى لشركة طاقة بريطانية خسرت 243 ألف دولار جراء انتحال صوت الرئيس التنفيذي للشركة الأم عبر الهاتف.

لماذا يصعب اكتشاف الأصوات المزيفة؟

تكمن المشكلة في أن الإنسان بطبيعته يربط الصوت بالهوية، وتشير دراسة بحثية إلى أن المشاركين في التجارب أخفقوا في التمييز بين الأصوات الحقيقية والمولدة بالذكاء الاصطناعي في نسبة كبيرة من الحالات، وأظهرت الدراسة أن ثقة المشاركين في قدرتهم على الاكتشاف كانت أعلى من قدرتهم الفعلية على ذلك.

ويعود ذلك إلى عدة أسباب: التطور السريع في نماذج الذكاء الاصطناعي، وقدرة الأنظمة على محاكاة الانفعالات البشرية، واعتماد البشر على السياق الاجتماعي والثقة المسبقة، ومحدودية قدرة الأذن البشرية على اكتشاف الفروق الدقيقة.

كثير من الأشخاص يجدون صعوبة في التمييز بين الأصوات الحقيقية وتلك المولدة بالذكاء الاصطناعي (شترستوك)

إستراتيجيات الحماية

لمواجهة هذا التهديد المتطور، لا بد من تبني إستراتيجية أمنية متعددة الطبقات تشمل الجوانب الإنسانية والتقنية والمؤسساتية.

1. على المستوى العائلي والشخصي

بروتوكول "كلمة السر العائلية": اتفاق أفراد العائلة في الغرف المغلقة على كلمة سر عشوائية تماما مثلا، "السقف الأزرق" أو "القطة المشمسة"، وفي حال تلقي أي مكالمة طوارئ من أي فرد يطلب مالا أو مساعدة، يتم مطالبته بكلمة السر فورا، إذا تعذر أو ارتبك، يغلق الخط فورا.

قاعدة "اتصل أنت": عند تلقي أي مكالمة مريبة من صديق، أو بنك، أو قريب، يجب إنهاء المكالمة فورا، والانتظار لمدة دقيقة، ثم إعادة الاتصال بالشخص عبر رقمه المحفوظ في قائمة الاتصال الخاصة بك، وليس عبر تتبع الرقم الذي اتصل بك لتجنب تقنيات تزييف أرقام المتصلين المتقدمة.

تقنين البصمة الصوتية العامة: تجنب نشر مقاطع فيديو أو تسجيلات صوتية طويلة وواضحة على الحسابات العامة غير المحمية في وسائل التواصل الاجتماعي، حيث تمثل هذه المقاطع المناجم الأساسية التي يتغذى عليها المحتالون لجمع عينات أصواتكم.

2. على مستوى الشركات والمؤسسات

إعادة هيكلة الصلاحيات المالية: ومنع اعتماد أي تحويل مالي أو بروتوكول حساس بناء على أمر صوتي منفرد حتى لو كان من رئيس مجلس الإدارة. ويجب تفعيل نظام "الموافقة المزدوجة المتعددة القنوات"، بحيث يتبع الأمر الصوتي تأكيدا عبر بريد إلكتروني مشفر أو توقيع رقمي (Digital Signature).

دورات محاكاة التصيد الصوتي (Vishing Simulations): إخضاع الموظفين، لا سيما في الأقسام المالية والموارد البشرية، لتدريبات دورية واختبارات فجائية بمكالمات مزيفة عبر الذكاء الاصطناعي، لرفع حساسية التشكيك والنقد لديهم.

3. الحلول التقنية والبرمجية

أنظمة كشف التزييف العميق البيومترية، حيث تدمج الشركات الكبرى الآن برمجيات تحلل البصمة الصوتية في الخلفية أثناء المكالمات. وهذه البرمجيات لا تبحث عن نبرة الصوت، بل تبحث عن "الآثار الرقمية" والترددات غير البشرية التي تتركها خوارزميات الذكاء الاصطناعي أثناء توليد الصوت، والتي لا تستطيع الأذن البشرية المجردة التقاطها.

يؤكد الخبراء أن الذكاء الاصطناعي أحدث ثورة هائلة في مجال إنتاج المحتوى الرقمي، لكنه في الوقت نفسه أوجد تحديات أمنية غير مسبوقة، فالصوت الذي كان ينظر إليه باعتباره بصمة شخصية فريدة أصبح من الممكن استنساخه خلال دقائق باستخدام أدوات متاحة على نطاق واسع.

ومع تزايد الاعتماد على الاتصالات الرقمية والعمل عن بعد والخدمات الإلكترونية، أصبحت القدرة على التحقق من الهوية أكثر أهمية من أي وقت مضى.

إقرأ المزيد

فن وترفيه المزيد

إقتصاد وأعمال المزيد