Rekord feltöltés

A MokkaWiki wikiből

(Változatok közti eltérés)
(A rekordok átvétele)
 
(13 közbeeső változat nincs mutatva)
1. sor: 1. sor:
== Bevezetés ==
== Bevezetés ==
Sajnos a [http://ww3.mokka.hu MOKKA]-ba érkező rekordok messze nem egységesek. Ebben az állapotban a rekordok nem kerülhetnek egy közös adatbázisba, ezért a [http://ww3.mokka.hu MOKKA] végez egységesítést a rekordokon. Ez a procedúra bonyolulttá teszi a rekordok feltöltését.
Sajnos a [http://ww3.mokka.hu MOKKA]-ba érkező rekordok messze nem egységesek. Ebben az állapotban a rekordok nem kerülhetnek egy közös adatbázisba, ezért a [http://ww3.mokka.hu MOKKA] végez egységesítést a rekordokon. Ez a procedúra bonyolulttá teszi a rekordok feltöltését.
 +
 +
 +
== Biztonság ==
 +
A MOKKA szerver biztonsága érdekében csak az előre regisztrált könyvtárak tölthetik fel a rekordokat. Előzetes regisztráció nélkül a szerver a rekordokat nem veszi át, amit a feltöltő program jelez a felhasználó felé.
 +
 +
== Rekordcsomag fejlécének elemei ==
 +
Ez kötelező:
 +
Content-Type: application/x-marc
 +
 +
Ez kötelező:
 +
X-MOKKA-Location:  <katalógus OSZK-kód>
 +
 +
Ez nem kötelező, de ajánlott:
 +
X-Content-Charset: <karakterkódolás, pl. UTF-8 vagy X-ANSEL>
== A rekordok átvétele ==
== A rekordok átvétele ==
-
A rekordok egy [http://en.wikipedia.org/wiki/Internet_socket TCP socket]-on keresztül érkeznek meg a szerverre. A hálózati hibakezelést a TCP biztosítja. A beérkezett rekordok egy átmeneti tárolóba un. [[munkafájl]]ba kerülnek. A munkafájl neve a rekordot felküldő számítógép [http://hu.wikipedia.org/wiki/IP_c%C3%ADm IP címe] + a felküldő által a [[rekordcsomagban]] elhelyezett X-MOKKA-Location header értéke. A feltöltés közben a súlyos MARC hibákat jelezzük, illetve a feltöltés végén kiirjuk az átvett rekordok számat. Ezeket az üzeneteket a socketokat olvasva lehet megkapni.
+
A rekordok egy [http://en.wikipedia.org/wiki/Internet_socket TCP socket]-on keresztül érkeznek meg a szerverre. A hálózati hibakezelést a TCP biztosítja. A beérkezett rekordok egy átmeneti tárolóba un. [[munkafájl]]ba kerülnek. A munkafájl neve a rekordot felküldő számítógép [http://hu.wikipedia.org/wiki/IP_c%C3%ADm IP címe] + a felküldő által a [[rekordcsomagban]] elhelyezett X-MOKKA-Location header értéke.
== A rekordok egységesítése ==
== A rekordok egységesítése ==
12. sor: 26. sor:
== java utility ==
== java utility ==
-
A saját feltöltő programmal nem rendelkező könyvtárak igénybe vehetik a Mokka által biztosított [http://www.mokka.hu/files/Corvina_MokkaUpload.jar feltöltőt]. Jelenleg (2009 november) 1.6-os Java futtató környezet szükséges a működtetéséhez. A program használata parancssorból a következő:
+
A saját feltöltő programmal nem rendelkező könyvtárak igénybe vehetik a Mokka által biztosított [http://wiki.mokka.hu/w/images/2/2e/Corvina_MokkaUpload.jar feltöltőt]. Jelenleg (2011 július) 1.6-os Java futtató környezet szükséges a működtetéséhez. A program használata parancssorból a következő:
-
  java -classpath Corvina_MokkaUpload.jar corvina.tools.RemoteImport +mime '''KÖNYVTÁRKÓD''' upload.mokka.hu 5099 < '''file.mrc'''
+
  java -classpath Corvina_MokkaUpload.jar corvina.MokkaUpload '''KÖNYVTÁRKÓD''' '''file.mrc''' '''[-cs charset]'''
 +
 
 +
a '''KÖNYVTÁRKÓD''' helyére természetesen mindenkinek a saját könyvtárkódját (pl. SZ1, D1 stb.) kell beírnia, ez alapján:
 +
[http://www.odrportal.hu/web/guest/konyvtarak Könyvtárkód-feloldó] ( ez volt a régi [http://java4.oszk.hu/Konyvtarkod/ Régi Könyvtárkód-feloldó] )
a '''file.mrc''' -ben kellenek a bináris Marc rekordok, Ansel kódolással, egymástól nem
a '''file.mrc''' -ben kellenek a bináris Marc rekordok, Ansel kódolással, egymástól nem
elválasztva, hanem folyamatosan.
elválasztva, hanem folyamatosan.
-
a '''KÖNYVTÁRKÓD''' helyére természetesen mindenkinek a saját könyvtárkódját kell beírnia, ez alapján: [http://java4.oszk.hu/Konyvtarkod/ Könyvtárkód-feloldó]
+
a '''[-cs charset]''' opciót, ha nem alkalmazzuk, akkor alapértelmezés szerint ANSEL kódolást feltételezünk. Használata esetén a '''charset''' lehet ANSEL, UTF-8 vagy ISO-8859-2.
(értelem szerűen, ha nem ugyanabban a könyvtárban van a jar file és a feltöltendő marc rekordokat tartalmazó file, akkor az elérési útvonalakkal ki kell egészíteni.)
(értelem szerűen, ha nem ugyanabban a könyvtárban van a jar file és a feltöltendő marc rekordokat tartalmazó file, akkor az elérési útvonalakkal ki kell egészíteni.)
 +
A feltöltés befejeztekor egy szöveges üzenet jelenik meg, amely tartalmazza a feltöltési csomag azonosítót (ezzel később visszakereshető a regisztrált könyvtáraknak a rekordok feltöltési eseménye).
 +
 +
'''TIPP''' -> pl. ha az OPKM-ből (könyvtárkódja: B7) szeretne UTF-8 karakterkódolású rekorodkat feltölteni az itt látható utility segítségével egy opkm_export_201201.mrc nevű file-ból, akkor a következőképp teheti meg:
 +
java -classpath Corvina_MokkaUpload.jar corvina.MokkaUpload B7 opkm_export_201201.mrc -cs UTF-8
[[Category: Feltöltés]]
[[Category: Feltöltés]]
[[Category: Technikai háttér]]
[[Category: Technikai háttér]]
[[Category:ABC]]
[[Category:ABC]]

A lap jelenlegi, 2015. március 6., 07:39-kori változata

Tartalomjegyzék

Bevezetés

Sajnos a MOKKA-ba érkező rekordok messze nem egységesek. Ebben az állapotban a rekordok nem kerülhetnek egy közös adatbázisba, ezért a MOKKA végez egységesítést a rekordokon. Ez a procedúra bonyolulttá teszi a rekordok feltöltését.


Biztonság

A MOKKA szerver biztonsága érdekében csak az előre regisztrált könyvtárak tölthetik fel a rekordokat. Előzetes regisztráció nélkül a szerver a rekordokat nem veszi át, amit a feltöltő program jelez a felhasználó felé.

Rekordcsomag fejlécének elemei

Ez kötelező:

Content-Type: application/x-marc

Ez kötelező:

X-MOKKA-Location:  <katalógus OSZK-kód>

Ez nem kötelező, de ajánlott:

X-Content-Charset: <karakterkódolás, pl. UTF-8 vagy X-ANSEL>

A rekordok átvétele

A rekordok egy TCP socket-on keresztül érkeznek meg a szerverre. A hálózati hibakezelést a TCP biztosítja. A beérkezett rekordok egy átmeneti tárolóba un. munkafájlba kerülnek. A munkafájl neve a rekordot felküldő számítógép IP címe + a felküldő által a rekordcsomagban elhelyezett X-MOKKA-Location header értéke.

A rekordok egységesítése

A munkafájlból rendszeres időközönként, kivesszünk 100 rekordot, ha van. A rekordokat egy szürő átalakítja és ellenőrzéseket végez rajtuk. A végeredmény az adatbázisba töltő process un.: online update munkafájljába kerül, ahonnan rövid időn belül bekerül az adatbázisba.

A szűrők

A szűrőket a különböző katalogizálási gyakorlat miatt általában IKR-enként kell elkészíteni, de előfordul, hogy egy könyvtár katalogizálási gyakorlata annyira egyedi, hogy saját szűrőt kell készítenünk a számára.

java utility

A saját feltöltő programmal nem rendelkező könyvtárak igénybe vehetik a Mokka által biztosított feltöltőt. Jelenleg (2011 július) 1.6-os Java futtató környezet szükséges a működtetéséhez. A program használata parancssorból a következő:

java -classpath Corvina_MokkaUpload.jar corvina.MokkaUpload KÖNYVTÁRKÓD file.mrc [-cs charset]

a KÖNYVTÁRKÓD helyére természetesen mindenkinek a saját könyvtárkódját (pl. SZ1, D1 stb.) kell beírnia, ez alapján: Könyvtárkód-feloldó ( ez volt a régi Régi Könyvtárkód-feloldó )

a file.mrc -ben kellenek a bináris Marc rekordok, Ansel kódolással, egymástól nem elválasztva, hanem folyamatosan.

a [-cs charset] opciót, ha nem alkalmazzuk, akkor alapértelmezés szerint ANSEL kódolást feltételezünk. Használata esetén a charset lehet ANSEL, UTF-8 vagy ISO-8859-2.

(értelem szerűen, ha nem ugyanabban a könyvtárban van a jar file és a feltöltendő marc rekordokat tartalmazó file, akkor az elérési útvonalakkal ki kell egészíteni.)

A feltöltés befejeztekor egy szöveges üzenet jelenik meg, amely tartalmazza a feltöltési csomag azonosítót (ezzel később visszakereshető a regisztrált könyvtáraknak a rekordok feltöltési eseménye).

TIPP -> pl. ha az OPKM-ből (könyvtárkódja: B7) szeretne UTF-8 karakterkódolású rekorodkat feltölteni az itt látható utility segítségével egy opkm_export_201201.mrc nevű file-ból, akkor a következőképp teheti meg:

java -classpath Corvina_MokkaUpload.jar corvina.MokkaUpload B7 opkm_export_201201.mrc -cs UTF-8
Személyes eszközök