Was benutzt Du denn für eine Programm? Ich nehme AntConc, kostet auch nix, und damit geht es ganz einfach. Nachdem Du das gesamte Korpus geladen hast gehst Du auf den Reiter 'Word List' und dann auf Start. Jetzt kriegst Du die Liste, aber gleichzeitig auch types und tokens - nämlich rechts oben. Vorher solltest Du in den Optionen einstellen, dass tags ignoriert werden. Sonst werden die mitgezählt und dann gibt es ganz häufig die Wörter 'A' und 'B' mit denen ja nur die Sprecher kodiert werden und das sind natürlich ungültige tokens.