Was janwo angesprochen hat, geht ja in den Bereich der relationalen Datenbanken (Datenbanken, bei denen Daten mittels Tabellen und Beziehungen zwischen diesen abgebildet werden). Im Fachjargon der (relationalen) Datenbanken nennt man diese IDs 'Schlüssel' bzw. im konkreten Anwendungsfall Primär- (in der Ursprungstablle) bzw. Fremdschlüssel (wenn sie in einer anderen Tabelle referenziert werden). Allerdings weiß ich nicht, ob du dich mit diesen Begriffen belasten musst (außer dich interessiert das wirklich), da die Modellierung von Daten (in Datenbanken) eine Wissenschaft für sich ist (innerhalb der Informatik) und man sich da leicht verzetteln kann; denn eigentlich willst du ja wahrscheinlich Linguistik machen ;).
Wichtig ist aus meiner Sicht, dass du die Korpus- und die zugehörigen Metadaten in strukturierter Form vorliegen hast und diese leicht miteinander in Verbindung bringen kannst, so, wie janwo das vorgeschlagen hat, und zwar am besten so, dass du sie leicht in die für die jeweiligen Analysen notwendige Form (Kontigenztabellen, etc.) bringen kannst.