Olá Luiz,
Não colocamos isso por já termos o áudio, por serem aproximações, e porque, diferentemente do português, essa pronúncia muda muito dependendo da combinação de palavras. Por exemplo, separadamente "You and I" seria algo como /yu end ai/, mas na fala mais corrente, isso seria alterado para /yu en ai/, entre outros casos ainda mais graves. Por isso, preferimos sempre confiar no áudio dos falantes nativos, que vai passar uma realidade maior da língua para os alunos, e não apenas uma aproximação grosseira.
Pelo mesmo motivo, palavras separadas não fazem muito sentido, porque na vida real, os alunos vão usar as palavras combinadas em frases, e não individualmente. Dessa forma, é sempre melhor aprendê-las sendo pronunciadas dentro de uma frase e dentro de um contexto adequado.
Abraços!