Chuyển Âm Thanh (Audio, Video) Thành Văn Bản Sử Dụng Machine Learning
--- Bài mới hơn ---
Chuyển đổi âm thanh (từ file audio, video) thành dạng văn bản kịch bản
Nhận dạng giọng nói, tự động hóa việc thao tác nghe và viết lại nội dung đó dưới dạng văn bản script bằng Machine Learning.
Machine Learning by Google
Chúng tôi ứng dụng công nghệ Machine Learning của Google để chuyển thể các nội dung bạn yêu cầu.
120 ngôn ngữ
Khả năng nhận diện lên đến 120 thứ tiếng: Tiếng Việt, Anh, Pháp, Mỹ, Đức, Trung Quốc, Nhật Bản, Hàn Quốc…
Là công cụ duy nhất có khả năng nhận dạng Tiếng Việt đạt mức độ chính xác từ 85%-95% và sẽ còn được cải thiện theo thời gian.
Khả năng tự nhận diện ngôn ngữ
Tự nhận diện ngôn ngữ được sử dụng trong file audio/video lên đến 04 thứ tiếng trong cùng 01 file theo ngữ cảnh nhất định.
Sử dụng như một ngôn ngữ tự nhiên
Có thể nhận biết đâu là danh từ riêng, hoặc định dạng đúng số điện thoại, với số vốn từ vựng nhiều gấp 10 lần số từ có trong Oxford Dictionary.
VẬY CHÚNG TA BẮT ĐẦU NHƯ THẾ NÀO ?
Bạn hãy chọn gói dịch vụ phía trên và thực hiện theo hướng dẫn.
Audio thông thường được gọi là âm thanh (sound), đó là dạng sóng biểu diễn các tín hiệu âm thanh.
Trong ngữ cảnh xử lý ở đây, audio thuộc loại Digital audio, thể hiện dưới dạng file mà máy vi tính hoặc các thiết bị điện tử khác có thể xử lý được.
Điều này có nghĩa là chúng tôi không xử lý những audio dạng băng từ như cassette.
Video là một phương tiện điện tử dùng để ghi hình, copy, chiếu lại, phát sóng và hiển thị truyền thông hình ảnh chuyển động.
Cũng như audio, video ở đây thuộc loại Digital video, thể hiện dưới dạng file mà máy vi tính hoặc các thiết bị điện tử khác có thể xử lý được.
Điều này có nghĩa là chúng tôi không xử lý những đoạn video dạng băng từ như VHS.
MP3, WAV, FLAC, OGG, M4U, LINEAR16.
MP4, MKV.
Những file audio, video có thể có dung lượng rất lớn, từ hàng trăm MB đến nhiều GB; các bạn có thể:
- Upload lên các kênh public như Youtube, Soundcloud, Google Drive,… và gởi link cho chúng tôi.
- Gởi HDD, USB đến chúng tôi.
- Yêu cầu chúng tôi trực tiếp đến nhận file.
Bạn phải hiểu rõ việc sử dụng một bản audio/video phải tuân theo quyền tác giả của người trực tiếp tạo ra nội dung đó.
Chúng tôi cung cấp dịch vụ chuyển audio/video thành script và hoàn toàn không trực tiếp hoặc gián tiếp kinh doanh những bản script được tạo ra.
Có, những âm thanh làm ồn (âm thanh nền) sẽ được tự động bỏ qua.
Nếu file có nhiều người trao đổi thì những âm thanh nhỏ quá có thể bị xem là âm thanh nền, và sẽ bị bỏ qua.
Chuẩn rate đạt chất lượng tốt nhất là 16,000Hz. Hoặc tối thiểu là 8000Hz (tương đương âm thanh nghe qua điện thoại).
Tốc độ file tốt nhất là 100 mili giây mỗi frame, do vậy, không nên cố ý điều chỉnh tốc độ âm thanh nhằm giảm thời gian xử lý.
--- Bài cũ hơn ---