안녕하세요! 반도의 흔한 고2학생입니다!
제가 구상하고 있는 알고리즘이 있는데요,
보이스 풀이라는 폴더 안에 특정 사람의 목소리의 임의의 녹음파일을 많이 집어넣고
(특정 단어를 녹음한게 아닌 일상 대화등..)
그 풀 안에서 발음단위별 데이터를 추출한 다음 딥러닝으로 특징을 배우고
TTS시 억양이나 비음등을 추가하여 더 자연스럽게 보정하려고 하는데요...
목소리의 특징을 파악해 내는 알고리즘은 구글링 해보니 있는 것 같은데,
이게 어떤 특징을 잡는지 같은건 사이트에서 자체 모자이크를 해놓았더라구요 ㅠㅠ
그래서 어느것들이 어느정도로 개발됬는지 아직 척도를 잡을 수 없어서 질문드립니다...
제가 구상하고 있는 프로그램과 관련된 알고리즘들이 현재 어디까지 발전됬는지 알 수 있을까요?