Soft xài AI tương tự như D- I D và e.leve.n labs – Mr Nguyễn Hữu Thành

Được người em quen biết mời vào nhóm này, đọc được nhiều tài liệu thực chiến dù chưa hiểu gì nhưng cũng cảm ơn ACE rất nhiều. Do chỉ thích nghịch và chưa muốn mất phí nên 2 hôm rồi mình nghịch được 2 soft xài AI tương tự như D- I D và e.leve.n labs nên chia sẻ lại cho ACE nào có PC (cấu hình khỏe, Ram 32gb, VGA 3060) muốn “nghịch” thử.

  1. Sadtalker (https://github.com/OpenTalker/SadTalker) Chức năng la lá D – ID, kém hơn về khoản Eye blinking và Head moving.
  2. AI voice cloning – Tortoise (https://git.ecker.tech/mrq/ai-voice-cloning). Tạm thời mới chỉ clone English voice là tạm ổn, các model ngôn ngữ khác phải tự train. Cài đặt thì ACE vào link https://git.ecker.tech/…/ai-voice…/wiki/Installation

Với Tortoise thì chỉ cần vài mẫu audio vocal sạch là có thể clone ra voice từ text mình gõ vào soft. Nếu file audio mẫu dính cả Vocal và Music thì dùng tool https://ultimatevocalremover.com/ để tách vocals ra, có thể làm sạch vocal bằng setting plugin MDX — de noise.

(Video tham khảo: https://www.youtube.com/watch?v=dMymrRZDU3c)

==> Video mẫu 1 mình tạo bẳng ảnh (lấy từ MJ), voice chôm từ clip bỏ mịa nào méo nhớ (tách music ra, làm sạch vocals) xong dùng Sadtalker tạo ra video.

==> Video mẫu 2 tạo voice bằng Tortoise.