Horváth Iván
BÖLCSÉSZET A BÁBELI KÖNYVTÁRBAN
(In: 2000 - 1997. május)
A Művelődési és Közoktatási Minisztérium azt tervezi,
hogy fölállíttat egy nagy, központi számítógépet, azt
összekapcsolják az összes magyar gimnáziummal, és
arról fogják szolgáltatni mindazt, amit a Nemzeti
Alaptanterv tartalmaz. Ezzel a tervvel összefüggésben
íródott (még tavaly) az alábbi följegyzés.
Kevesen látták előre az új reneszánsz eljövetelét. Legtöbbször még a
hivatásos jövőbelátók, a tudományos-fantasztikus történetek szerzői sem. Úgy
képzelték, hogy a mesterséges értelem kutatásának vívmányai olyan robotok
lesznek, amelyek az emberfajjal szemben ellenséges vagy baráti érzelmekkel
viseltetnek. Nem gondolták, hogy a Világháló lesz az első eredmény, hogy a
mesterséges értelem semmivel sem lesz mesterségesebb a ceruzánál, hogy a
hálózatba kapcsolt milliónyi számítógép nem barátjává vagy ellenségévé,
hanem éppúgy részévé válik a személyiségnek, amiként a könyv vagy a
szemüveg.
A számítógép a maga ötvenéves története alatt hozott néhány változást az
emberiség életében, de nem alapvetőeket. Most úgy látszik, a Hálózat
teljesen újraírja a művelődés egész világát. A 21. század diákjai máshonnan
szerzik meg tudásukat, és más tudást szereznek meg, mint annak idején mi.
Jó ideje csökken már az írásbeliség szerepe a művelődésben, sőt a
műveltséget magát is egyre kevesebbre becsülik. A sokcsatornás
ismeretközlési eljárások megjelenése a bölcsészet szempontjából előnyökkel
és hátrányokkal jár. Új művészeti ágak keletkeznek a hangszobrászattól az
olyan mozgóképes történetig, amelynek a felhasználó egyúttal társszerzője és
főszereplője. A személyre szabott műsorral jelentkező, nagy felbontású,
térhatású, távolba látó a szórakoztatásnak szinte ellenállhatatlan műfajait
teremti meg. Az írni- és olvasnitudás lassú visszaszorulása aligha marad
abba.
Ezenközben óriási erőfeszítéssel folyik a művelődés lehető teljes
emlékanyagának, a tudomány, az irodalom, a zene, a képzőművészet
alkotásainak, a történelem forrásainak átírása a nyomtatott betű közegéből a
számjegy-jelölésű közegbe. S a kiválasztottak magukévá tehetik a
világkönyvtár és a képzeletbeli múzeum végtelen gazdagságát.
Feladatunk előmozdítani, hogy mennél több diák élni tudjon e második
lehetőséggel. Építsünk evégett egy hatalmas számítógépes rendszert, a tudás
afféle Tárházát, mely álljon rendelkezésére minden magyar gimnazista (és
persze egyetemista) diáknak. Nos, a bölcsészeti tárgyak szempontjából milyen
legyen ez a Tárház?
1. Neveléstani módszer
1.1 Van tanár, aki tanít, és van, aki hagy tanulni. A Tárház e második
csoportba tartozik. A legfontosabb ismeret, amelyet közvetít, az arra való
készség, hogy a tanuló egyedül is eligazodjék a hálózatok útvesztőiben. A
Tárház önállóságra nevel.
1.2 A diáknak mindig szüksége van egyszerűsített képletekre, a történeti
tudományokban is. Ám célját téveszti az olyan tanítás, amely nem képes a
további részleteket firtató kérdésekre megfelelni. Az `ad usum Delphini`, az
ifjúság számára való átdolgozás, az oktatási szakanyag készítése, a népszerű
átirat csak akkor helyénvaló (és csak akkor engedélyezhető), ha egyúttal
hozzáférhető az eredeti forrás is.
1.3 A Tárház irodalmi és történelmi anyaga soknyelvű legyen. A
bölcsészetben nem várható az angol egynyelvűség kialakulása.
1.4 Aki a hálózaton kalandozik, gyors ismeretszerzésre törekszik. A
szövegek ritkán haladják meg az egylapnyi terjedelmet, a bélyegméretű
képecskék gyorsan betöltődnek. Nos, a bölcsészet tárgyai általában nem
ilyenek. A `Máté-passiót` nem tudjuk két óra alatt magunkévá tenni. A `IX.
szimfónia` és a `Háború és béke` nem multimédiás alkotások. S ha a róluk
szóló oktatási segédanyagot telehalmozzuk is hiperszöveges kapcsolatokkal, a
műveket magukat akkor is hagyományosan kell befogadnunk. Ebből fakad az
oktatási segédanyagokkal szemben megfogalmazandó ama szigorú követelmény,
hogy e segédanyagoknak (akár hiperszövegesek és multimédiásak, akár nem)
kifejezetten a hagyományos befogadói eljárásokat, a sok órán keresztül
történő olvasást, képnézést, elmélyült zenehallgatást kell előmozdítaniuk. S
ha netán a feladat nehezen megoldható vagy épp megoldhatatlan, még az sem
lehet ok arra, hogy megfeledkezzünk erről a célról.
1.5 Az elsődlegesen a gimnazistákat szolgáló Tárházat nemcsak az
egyetemistától, hanem a gimnáziumi tanártól sem szabad elrekeszteni. Őt sem
foszthatjuk meg a felkészülés leghatékonyabb eszközétől. Sőt: a nagyon
eltökélt felhasználó lelhessen akár még kutatási terepre is a Tárházban.
Újra vissza kell térni azokhoz az időkhöz, amikor a gimnáziumi tanárok java
még doktorátust szerzett, és néhány közlemény erejéig kivette a részét a
tudományos kutatás feladataiból.
2. Milyen legyen a Tárház?
2.1 A számítógépet a bölcsészetben régebben (1949) alkalmazzák, mint a
legtöbb természettudományban. Nincs is ezen semmi csodálkoznivaló. Szemben
például a matematika vagy az elméleti fizika egyes kérdéseivel, a történeti
tudományokban nincs olyan terület, ahol mellőzhető lenne a számítógép,
hiszen a történész nem mondhat le a teljes tudható tudás birtoklásáról.
2.2 A pontos természettudományok ritkán foglalkoznak olyan jelenségekkel,
amelyeket nem lehet megismételni. A történeti tudományok épp fordítva, főleg
az egyszer volt dolgok megismerését tűzik ki céljukul. A Tárháznak ezért
elvben bizony tartalmaznia kellene a múlt minden emlékét. Az adatok túlnyomó
részének bevitelére bölcsészek fognak igényt tartani.
2.3 Sem az adatbevitel, sem az adatok karbantartása belátható időn belül
nem zárulhat le.
2.4 A bölcsészeti adatbázisok építésében Magyarország a hetvenes évek óta
a világ élvonalába sorolható. Helyes, ha a Tárház épít a már elért
eredményekre és tapasztalatokra.
3. Milyen adatbázisok felelnek meg a Tárház céljainak?
3.1 Az adatokbázisoknak legyen kettős felhasználói felületük: egy az
elmélyült kutatás, és egy a gyors, hatékony oktatás számára. Tudományosan is
helyes és pontos adategyüttes, gondosan rögzített, betűhű szöveg legyen az,
amit elfedünk a barátságos átírással, a kényelmesen kezelhető felülettel.
Legyen benn az adatbázisban mind az idegen nyelvű forrás, mind pedig annak
világos, magyar fordítása. Legyen benn a latin oklevél, de kétmondatos
magyar kivonata is. Legyen benn a kézirat részletdús és színhű
fényképhasonmása valamint aggályosan pontos átírása, de a kisebb igényű
tanulónak álljon rendelkezésére egy mai helyesírásra áttett, jól olvasható
változat is, amelyben például a keresések egyszerűbben hajthatók végre.
3.2 Az adatbázisok lehetőleg különnemű adatokat tartalmazzanak, hogy tág
tere nyíljék a kevéssé nyilvánvaló kérdéseknek. Egy irodalmi szövegeket
tartalmazó adatbázis tanulmányozóját az is érdekelheti, hogy az illető művet
hányszor, hol, mikor és kik adták ki nyomtatásban, s ha a mű fordítás, akkor
még mely műveket fordítottak ugyanattól a szerzőtől vagy ugyanabból a
nyelvből, s ha a mű vers, akkor versformája ismeretes volt-e annak előtte
is, aztán milyen műfajú verseket írtak az idő tájt abban a versformában stb.
Helyes, ha a tanulók olyanfajta kereséseket is megfogalmaznak, amilyeneket
az adatbázisok tervezői nem láttak előre.
3.3 A történeti tudományokban a feltevések ellenőrzése évekbe telik. A
Tárház adatbázisai nagyon nagy anyag könnyed áttekintését tegyék lehetővé,
és ezáltal csökkentsék a feltevések megfogalmazásának kockázatát.
3.4 A műalkotásokat rögzítő képi, mozgóképi és hangállományoknak
érzékszervileg hiteleseknek kell lenniük. Ez a kétszintes adatbázisok
mélyebb szintjein képek esetében több ezer soros felbontást és több
tízmillió színt jelent, szobrok és épületek esetében lehetőleg hologramot,
mozgókép esetében valamelyik számjegykódos HDTV-szabvány alkalmazását,
hangok esetében pedig két csatornán legalább másodpercenként 44.100
mintavételt, és legalább 16 bites felbontást. A kisebb igényű felhasználás
számára az egyelőre még nagyon szűk sávszélességű Internet hálózaton
szokásos formátumokról is gondoskodni kell (64000 színt megkülönböztető kép,
8 bites hang stb.), de tudnunk kell, hogy ezek a formátumok belátható időn
belül elavulnak.
4. Általános adatmodell
4.1 A bölcsészettudományokban az adatok olyan szöveges, képi vagy
hangállományok, amelyeknek hordozóit is nyilvántartjuk (irodalmi művek
esetében például a nyomtatott kiadásokat és a kéziratokat), és igényt
tartunk arra, hogy kérdéseinket akár az elsődleges adatok, akár a hordozók
felől tegyük fel. Épp a magyar irodalomtörténeti adatbázisok építéséből
leszűrt általános tapasztalat, hogy a valóságot legpontosabban leíró
adatfelvételi alapegység (a "record") nem az elsődleges adat (a példában: az
irodalmi mű), és nem is a hordozója (a példában: az egyik kiadás), hanem egy
elsődleges adatnak (műnek) és egy hordozónak (egy bizonyos kiadásnak)
találkozása, hiszen a különböző hordozókhoz (kiadásokhoz) tulajdonképpen
különböző elsődleges adatok (szövegváltozatok) tartoznak: a több forrásban
előforduló irodalmi mű a népköltészeti alkotásokra hasonlít.
4.2 Helyes, ha a tanulók a szöveges adatbázisokban szemantikai, a
szövegrészletek jelentésére vonatkozó kereséseket is végezhetnek. (Ez a
kívánalom a gépi fordítás kérdésével függ össze.)
5. Szövegrögzítési eljárások
5.1 Mivel az adatbázisokat célszerű ellátni mind tudományos, mind
oktatási felülettel (3.1), ugyanígy a szövegrögzítésben is kétfélét kell
nyújtanunk: a tudományos igényű mellett egy könnyen olvashatót is.
5.2 A magyar irodalomtudomány főleg a következő, elvileg is jó, egymással
is megférő szövegrögzítési eljárásokat használja, s ezért mindegyikük
ajánlható:
5.2.1 hasonmással szinkronizált betűhű átírás (Balassa-kódex),
5.2.2 morfo-fonematikai átírás (POEM-adatbázis), mely elsősorban a
szemantikai lekérdezéseket könnyíti meg,
5.2.3 betű-szám-jelölő (az MTA Nyelvtudományi Intézetének eljárása),
5.2.4 HTML fényképhasonmás nélkül, de szövegváltozatokkal (Internet
József Attila-adatbázis),
5.2.5 ugyanez fényképhasonmással (Internet Balassa-kódex),
5.2.6 SGML (és a Text Encoding Initiative),
5.2.7 jól használható továbbá minden, lehetőleg 7 (a legszigorúbb
hálózati szabványoknak is megfelelő), vagy esetleg 8 bites olyan szöveg-
és kiadványszerkesztő (például SGML, HTML, TEX, Ventura, AmíPro, WordPro,
XyWrite, NotaBene, Word RTF), amelynek utasításai beszúródnak a szövegbe.
Amit így rögzítettünk, az akár évtizedek múltán is tökéletes pontossággal
átalakítható marad bármely más, hasonló szerkezetű szöveg- vagy
kiadványszerkesztő követelményei szerint.
5.3 A tanulók által könnyen olvasható felület számára viszont egyelőre
nincs jó megoldás. A Művelődési és Közoktatási Minisztérium által országosan
elterjesztett újabb Microsoft-termékek (Windows 3.1, Windows for Workgroups,
Windows 95) betűkódtáblája nem felel meg a magyar szabványnak, így ezeknek
tulajdonképpen kereskedelmi forgalomba sem lett volna szabad kerülniük. A
IBM OS/2 szabványos, de nem élvezi az állam támogatását. Függetlenül az
apróbb hátrányoktól, természetesen mindenképp igazodnunk kell a nemzeti
szabvány előírásaihoz.
5.4 A bölcsészettudományokban a nagy történeti anyagot felölelő
adatbázisokhoz képest az oktatási szakanyagok fontossága másodrendű, de
semmiképp nem jelentéktelen. Az ilyen szakanyagokat természetesen
hiperszövegként kell elkészíteni. Az egyetlen szóba jöhető formátum a HTML.
A HTML-állományokban ideiglenesen elfogadható a magyar szövegekben rendkívül
ritka, tildés magánhangzó a kétvessző-ékezetes betűk helyett, de csak addig,
amíg a nemzetközi HTML-ajánlásból hiányoznak ezek a betűk.
A szakanyagok alkotói legyenek tekintettel arra, hogy a tanulók teremtő
képzeletét és együttműködő hajlandóságát akár közös szövegszerkesztéssel is
(ilyen eszköz ma a Lotus Notes) fejleszthetjük.
6. Munkaszervezés
6.1 Az államköltségen létrehozandó adatbázisokhoz a hozzáférést nem
helyes korlátozni. Meg kell viszont vásárolni számos külföldi, az Interneten
nyilvánosan nem hozzáférhető adatbázis korlátozott használati jogát is. Ha
ez nem történhet meg, megvizsgálandó, hogy a Tárház mint intranet,
egyáltalán nyújt-e elég előnyt az Internethez képest.
6.2 A adatbázisok létrehozásának feladatát természetesen össze kell
hangolni az MKM és a hasonló pályázatot tervező OMFB között.
6.3 A feladat egy könnyű és egy nehéz részre tagolható. Könnyű
megrendelni számítógépet, vezetéket, programcsomagot. Nehéz szakanyagokat és
különösen adatbázisokat létrehozni. Ámde - mint az informatikában mindig -
ezúttal is a helyes sorrendet kellene betartani. Először felállítjuk a
feladatot, másodszor megvizsgáljuk, hogy milyen szoftver alkalmas a feladat
megoldására, és csak harmadszor nézünk olyan hardver után, amelyen
működtetni lehet a kiválasztott szoftvert. Másszóval: először kellene kiírni
és elbírálni a pályázatot, azután megállapítani, hogy milyen szoftverek
jöhetnek számításba, és csak ezután lenne szabad foglalkozni a szükséges
sávszélesség felelősségteljes megállapításával, majd a hardver
beszerzésével. Egyelőre még az sem tudható, hogy egyetlenegy helyről kell-e
szolgáltatni az adatokat, vagy egy részüket onnan, ahol keletkeztek, és ahol
az adattulajdonosnak felügyeleti joga van.