في عصر تتسارع فيه وسائل الإعلام الرقمية، أصبح المحتوى الصوتي والمرئي أحد أهم أدوات التواصل ونقل المعرفة.
سواء المحاضرات والدروس، إلى المقابلات والبودكاست، تزداد الحاجة إلى تحويل هذا المحتوى إلى نص مكتوب، سواء لأغراض البحث، الأرشفة، الترجمة أو حتى تحسين الوصول للأشخاص ذوي الاحتياجات الخاصة.
هذه العملية تعرف بـتفريغ المحتوى الصوتي Video to text.
طريقة تحويل محتوى فيديو إلى نص مكتوب بكل سهولة
جدول المحتويات
أهميته في المجال التعليمي
- في المجال التعليمي، يسهم التفريغ الصوتي المرئي في كسر حاجز اللغة من خلال إمكانية ترجمة المحتوى المنطوق، كما يتيح لذوي الإعاقات السمعية متابعة الدروس عبر قراءة النصوص المكتوبة. فضلًا عن ذلك، يمكن الاستفادة منه في إنشاء موارد تعليمية مساعدة، مثل أدوات البحث والمراجعة وتلخيص الدروس.
ما هو تفريغ المحتوى الصوتي؟
- لتحويل التسجيلات الصوتية أو مقاطع الفيديو إلى نص مكتوب، من الضروري تحويل الحوار والشرح وأحيانًا الأصوات المصاحبة.
- يمكن أن يتم هذا التفريغ يدويًا أو آليًا باستخدام تقنيات الذكاء الاصطناعي.
لماذا نلجأ لتفريغ الصوت إلى نص؟
- تحسين الوصول
- سهولة الفهم والرجوع
- دعم محركات البحث (SEO)
الكود عبر موقع Cola
الكود:
# ✅ 1. إعداد البيئة
!pip install -q yt-dlp git+https://github.com/openai/whisper.git
!sudo apt-get -y install ffmpeg
# ✅ 2. تحميل فيديو من يوتيوب كـ mp3
import yt_dlp
import os
video_url = "https://www.youtube.com/watch?v=XXXXXXXX" # ← ضع رابط الفيديو هنا
ydl_opts = {
'format': 'bestaudio/best',
'outtmpl': 'audio.%(ext)s',
'postprocessors': [{
'key': 'FFmpegExtractAudio',
'preferredcodec': 'mp3',
'preferredquality': '192',
}],
}
with yt_dlp.YoutubeDL(ydl_opts) as ydl:
ydl.download([video_url])
# ✅ 3. استخدام Whisper لتحويل الصوت إلى نص
import whisper
model = whisper.load_model("base") # يمكنك تجربة "medium" أو "large" لجودة أفضل
result = model.transcribe("audio.mp3") # يمكن إضافة language='ar' لتحديد اللغة
# ✅ 4. عرض النتيجة
print("📄 النص المستخرج:\n")
print(result['text'])
# ✅ 5. حفظ النص في ملف Markdown
with open("output_file.md", "w", encoding="utf-8") as f:
f.write(result['text'])
print("\n📄 تم حفظ النص في ملف output_file.md")
# ✅ 6.prompt: export file.pdf
!sudo apt-get install texlive-xetex texlive-fonts-recommended texlive-plain-generic
!pip install -q pandoc
!pandoc output_file.md -o file.pdfشرح خطوات تشغيل الود في كولاب:
- استبدل رابط الفيديو من اليوتيوب.
- افتح موقع google colab.
- اضغط على زر التشغيل.
- استلم النص المكتوب بصيغة.
- خطوة غير ضرورية وهي استلام النص المكتوب بصيغة file.md.
- تحميل الملف على الجهاز وقراءته بأي متصفح بصيغة file.pdf.
- تحميل الملف على الجهاز وقراءته بأي متصفح بصيغة file.mp3.
خلاصة
الحصول على ثلاثة ملفت audio.mp3 وfile.md وfile.pdf.
Tags
البيثون
