DiÖ-DB benutzen

Benutzername & Passwort

Bevor man auf die Datenbank zugreifen kann, benötigt man einen Benutzernamen und ein Passwort – bei Bedarf bitte bei der LV-Leitung melden.
Der Benutzername besteht aus vorname.nachname, das Passwort wird per Mail zugeschickt.

Wichtig: Beim ersten Login ist das Passwort unbedingt zu ändern!

 

DB_1

 

Einloggen

Die Datenbank wird über den Browser (bevorzugt Chrome) geöffnet.

Bitte nur über den eigenen und keine öffentlichen PCs einloggen und immer nach der Benutzung ausloggen! 

URL: https://dioedb.demo.dioe.at

 

Übersichtsseite

Nach dem Log-in gelangt man auf die Übersichtsseite, von der aus man die Korpus-Datenbank (Korpus DB) und die Annotations-Datenbank (AnnotationsDB) durch einen Klick  aufrufen kann. In der KorpusDB passieren sämtliche Arbeiten (Anhören, Transkribieren, Annotieren) an den kontrollierteren Daten (Experimente, Leseliste, Wenker-Übersetzungen). In der AnnotationsDB können die freien Gespräche (Interviews, Freundesgespräch) angehört und annotiert werden. 

DB_2

 

Korpus DB: Eingabemaske

Um die KorpusDB zu öffnen klickt man auf "Eingabe SPT" (siehe Bild oben). 

Um ausgewählten Aufgaben anzuhören, muss bei „Filter:Erhebung“ das richtige Erhebungssetting ausgewählt werden. (Alternativ kann auch nach den einzelnen Gewährspersonen ("Filter: Informant") oder nach Phänomenen gefiltert werden.)

LesenWortliste: Vorlesen der Wortliste

SPT-D: Sprachproduktionsexperiment im intendierten Dialekt

SPT-S: Sprachproduktionsexperiment im intendierten Standard

Übersetzung (D-S): Übersetzung der Wenkersätze vom Dialekt in den Standard

Übersetzung (S-D): Übersetzung der Wenkersätze vom Standard in den Dialekt

DB_3

 

Im Fenster „Aufgabenset“ kann nun das Aufgabenset ausgewählt werden. Die Benennung zeigt an, um welches Phänomen es sich jeweils handelt.

DB_4

In einem Aufgabenset sind mehrere Aufgaben zu ebendiesem Phänomen gruppiert, diese können im Fenster „Aufgabe“ entsprechend ausgewählt werden.

 

Schließlich kann jene Gewährsperson, die bearbeitet werden soll, ausgewählt werden. Die Gewährspersonen sind mit ihrer ID und einer Abkürzung des Erhebungsorts aufgelistet.

ALLE: Allentsteig

GAWE: Gaweinstal

HÜTT: Hüttschlag

NECK: Neckenmarkt

NEUMY: Neumarkt/Ybbs

OBER: Oberwölz

PASS: Passail

RAGG: Raggal

STEY: Steyrling

TARR: Tarrenz

TAUF: Taufkirchen

TUXT: Tux

WEIS: Weißbriach

DB_6

 

Antwort anhören

Durch einen Klick auf den Play-Button unten kann die Aufnahme für die jeweilige Aufgabe abgespielt werden.

DB_7

 

Transkribieren

In den verschiedenen Spuren "standard" (Standardorthografische Transkription), "transkri

pt" (lautorientierte Transkription) und "IPA-Transkript" (phon. Transkription) kann die dementsprechende Transkription angefertigt werden. 

Tipp: Bei der Eingabe erscheint auch eine zusätzliche Tastatur zur phonetischen Transkription! 

DB.jpg

 

Annotieren

Um eine Antwort mit einer (bereits bestehenden) Annotation zu versehen klicken Sie auf "+Tag Ebene" und wählen Ihre Tags aus. 

Exportieren

Um die transkribierten und/oder annotierten Antworten zur Weiterbearbeitung in Excel zu exportieren klicken Sie im Drop-Down-Menü zu "KorpusDB" auf "Auswertung". Hier können Sie angeben, ob Sie nur die Antworten ("Antworten") oder die Antworten und die Annotationen ("Antworten (Tag Ebenen)") downloaden wollen. Dann ist wiederum das Setting und das Phänomen auszuwählen. 

Annotations DB

Die Annotations DB unterteilt sich in:

1. das Annotationstool

Das Annotationstool wird verwendet, um bereits bestehende Transkripte zu annotieren. Nach der Auswahl des Transkripts in der Liste (über die SprecherInnen-ID) öffnet sich folgende Ansicht des Transkripts:

Annotool-UI-Neu.png

  1. Zeigt eine kurze Transkript-Statistik an.
  2. Blendet allgemeine Informationen zum Transkript ein und aus.
  3. Blendet Ansichtsoptionen ein. Hier lassen sich die Event-Tiers und Tokenset-IDs zuschalten (standardmäßig abgewählt), die unter/über den jeweiligen Events und Tokensets angezeigt werden. Zusätzlich lassen sich die tatsächlichen Tags über Tokensets anzeigen. Mit der Auswahl "Benutzte Tagebenen anzeigen" wird nur die jeweilige Ebene über allen Tokensets angezeigt. Wählt man eine bestimmte Ebene aus, so wird der gesamte Tag auf dieser Ebene über den betreffenden Tokensets angezeigt. 
  4. Blendet Filteroptionen aus und ein. Mit diesen Filtern lässt sich verändern, welche SprecherInnen und Spuren angezeigt werden.
  5. Blendet Suchfunktion aus und ein.
  6. Blendet eine Übersicht über die Tastaturshortcuts aus und ein.
  7. Zeitleiste des Audioplayers (STRG + Klick um von gewünschter Stelle an abzuspielen).
  8. Steuerung des Audioplayers.
  9. Speicherknopf

Annotieren in der AnotationsDB

Um ein Token/Wort zu annotieren, klickt man auf dieses Wort, um es auszuwählen (grün unterlegt). Bei einem weiteren Klick auf ein angewähltes Token öffnet sich das Popup zur Annotation eines einzelnen Token.

Einzeltoken-5.png

Um diesem Token eine Annotation beizufügen, klickt man auf  „Antwort erstellen“ und wählt die gewünschten Tags aus. 

Außerdem kann auch eine Token-Span erstellt und anschließend nach dem gleichen Prinzip (Klick auf die Spanne) eine Annotation dazu erstellt werden.

Die Tastenkombination um eine durchgängige Folge an Token zu annotieren ist Shift + Klick. Dazu einmal auf den Beginn des zu annotierenden Bereich klicken, Shift drücken, und das letzte Token des Tokensets anklicken. Alle Token eines Sprechers, die zwischen diesen beiden Token liegen, werden zu dem Tokenset hinzugefügt (bei diesem Beispiel von ja bis ((lachen))).

Tokenspan-annotated.png

Annotating-Tokensets.png

 

2. Anno-sent

Durch Anno-sent ist das gesamte Korpus des SFB DiÖ durchsuchbar. Dies bietet sich besonders bei Fragestellungen, die die Lexik betreffen, an. Z.b. lässt sich das Korpus durch Lemmata (wie z.B. Paradeiser versus Tomate) durchsuchen, um Einblicke zu erhalten, wie frequent die einzelnen Lexeme auftreten.

 

3. Anno-check

Anno-check dient primär der Überprüfung und Anpassung bereits bestehender Annotationen. 

Anno-Check lädt direkt beim Öffnen  alle „Antworten“ der Sprachproduktionsexperimente und es kommt zur Anzeige „Fehler! Kein Satz übergeben!“. Das kann hier aber getrost ignoriert werden, da noch keine Suachanfrage getätigt wurde und hier Daten "sichtbar" sind, die noch nicht transkribiert wurden.  also hier ignoriert werden.

Um Anno-Check nun zu nutzen, müssen  Filterkriterien festgelegt werden, i.e.: Was will ich sehen? Dabei lässt sich nach filtern nach:

Tag Ebene: meist das konkrete Phänomen, z.B. KONJ (Konjunktiv)

Tag: Teil der gesamten Annotation, z.B. Kperi (periphrastischer Konjunktiv)

Nicht Tag: darüber kann ausgeschlossen werden, welche Ergebnisse nicht auftauchen sollen, z.B. würdeK (würde Konjunktiv) (--> Suchanfrage über Tag Ebene: KONJ, Tag: Kperi, Nicht Tag: würdeK findet somit nur periphrastische Konjunktivformen mit täte)

Informant: Die einzelnen InformantInnen können über Ihre Sigle ausgewählt werden.

Transkript: Neben jedem einzelnen Transkript (Interviews und Freundesgespräche) können auch Teil-Korpora (Nur Transkripte bedeutet alle freien Gespräche (INT, FG); Keine Transkripte bedeutet kontrolliertere Settings (SPE, Wenker, Leseliste) geladen werden.

Aufgabensets: Um nicht die gesamten kontrollierten Daten zu laden, gibt es die Möglichkeit, dass nur ausgewählte Aufgabensets (z.B. Wenkersätze, ARTM (=Artikel vor Massennomen) der kontrollierten Erhebungen angezeigt werden.

Aufgabe: Mit "Aufgabe" lässt sich noch feiner filtern, innerhalb des Aufgabensets lässt sich weiters nur eine Aufgabe anzeigen, z.B. einzelne Wenkersätze

Annocheck-2.png

Nachdem die entsprechenden Filter gesetzt wurden, erscheint die Antwort-Tabelle. In der Tabelle lässt sich jede Antwort anklicken, wordurch sich ein Pop-Up-Fenster zur Bearbeitung öffnet, in dem sich  die Tags in gewohnter Weise verändern lassen und die Antwort anzuhören ist.

4. Anno Auswertung 

Unter Anno Auswertung können annotierten Daten zur Weiterbearbeitung in Excel heruntergeladen werden. Dabei wählt man wiederum die Erhebung (FG, INT, SPE,...) sowie die Tag Ebene. Um die Datei zum Herunterladen zu erstellen klickt man auf "XLS Datei am Server generieren", um Sie dann "als XLS herunterladen" kann.

Auswertung.jpg

! Achtung: Die Datei ist leider häufig zu groß und es kommt zu einer Fehlermeldung. Sollte dies passieren, so ist die bereits erstellte (XLS Datei am Server generieren) Datei zu finden unter "DB" bei "Dateien". Als Verzeichnis ist dann unter "annotationsdb" "auswertung" zu wählen. In diesem Ordner liegen dann alle generierten Tabellen, benannt sind diese nach der Nummer der Tag Ebene (z.B. tagebene_0_25). (Tipp: ein Blick auf das Erstellungsdatum kann bei der Suche nach der richtigen Datei hilfreich sein!).

Dateien.jpgVerzeichnis.jpg

 

Wichtig: Bitte bei Unsicherheiten/Problemen gerne bei der LV-Leitung nachfragen!