Hier ist die Übersetzung ins Chinesische, unter Berücksichtigung des akademischen Stils (SCI/SSCI): 揭示文本的本征维数:从学术摘要到创意故事
Vladislav Pedashenko Laida Kushnareva Yana Khassan Nibal Eduard Tulchinskii Kristian Kuznetsov Vladislav Zharchinskii Yury Maximov Irina Piontkovskaya

Abstract
Hier ist die Übersetzung des Textes ins Deutsche, verfasst im geforderten akademischen und fachsprachlichen Stil:Die intrinsische Dimension (Intrinsic Dimension, ID) ist ein bedeutendes Instrument in der modernen Analyse großer Sprachmodelle (LLMs), das Erkenntnisse zu Trainingsdynamiken, Skalierungsverhalten und Datensatzstrukturen liefert; ihre textuellen Determinanten sind jedoch bisher kaum erforscht. Wir legen die erste umfassende Studie vor, die die ID durch Cross-Encoder-Analysen, linguistische Merkmale und Sparse Autoencoders (SAEs) in interpretierbaren Texteigenschaften fundiert.In dieser Arbeit etablieren wir drei zentrale Ergebnisse. Erstens verhält sich die ID komplementär zu entropie-basierten Metriken: Nach Bereinigung um die Textlänge sind beide unkorreliert, wobei die ID eine geometrische Komplexität erfasst, die orthogonal zur Vorhersagequalität steht. Zweitens weist die ID eine robuste Genre-Differenzierung auf: Wissenschaftliche Prosa zeigt eine niedrige ID (~8), enzyklopädische Inhalte eine mittlere ID (~9) und kreatives/meinungsbildendes Schreiben eine hohe ID (~10,5) über alle getesteten Modelle hinweg. Dies offenbart, dass zeitgenössische LLMs wissenschaftliche Texte als „repräsentational einfach“ wahrnehmen, während Fiktion zusätzliche Freiheitsgrade erfordert.Drittens identifizieren wir mithilfe von SAEs kausale Merkmale: Wissenschaftliche Signale (formeller Ton, Berichtsvorlagen, Statistiken) reduzieren die ID; humanisierte Signale (Personalisierung, Emotion, Narration) erhöhen sie. Steuerungsexperimente (Steering Experiments) bestätigen die Kausalität dieser Effekte. Somit erscheint wissenschaftliches Schreiben für moderne Modelle vergleichsweise „einfach“, wohingegen Fiktion, Meinung und Affekt repräsentationale Freiheitsgrade hinzufügen. Unsere vielschichtige Analyse bietet eine praktische Orientierung für die korrekte Anwendung der ID und die fundierte Interpretation ID-basierter Ergebnisse.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.