bibliotheks-und-archivinfor.../kapitel-4/44-konfiguration-des-schema...

# 4.4 Konfiguration des Solr Schemas

Ab Solr Version 6.0 ist das sogenannte "managed schema" \(auch "schemaless mode" genannt\) voreingestellt. Solr analysiert bei der Indexierung die Daten und versucht das Schema selbst zu generieren. Felder können aber weiterhin zusätzlich manuell definiert werden.

## Schema über Admin-Oberfläche konfigurieren

* Admin-Oberfläche aufrufen. Im Menü "Core Selector" den Index "htw" auswählen. Dann im zweiten Menü "Schema" aufrufen. Direktlink: [http://localhost:8983/solr/\#/htw/schema](http://localhost:8983/solr/#/htw/schema)
* Button "Add Field" drücken
* Name eingeben \(Groß- und Kleinschreibung ist wichtig\)
* `field type` \(z.B. string\) auswählen
* ggf. die Checkbox `multivalued` markieren, wenn das Feld mehrere Werte \(getrennt durch ein Trennzeichen\) enthält

## "Catchall" Copy Field anlegen

In der Standardkonfiguration gibt es keine übergreifende Suche. Im [Query-Interface](http://localhost:8983/solr/#/htw/query) und in der [integrierten Suchoberfläche](http://localhost:8983/solr/techproducts/browse) müsste stets ein Feld bei der Suche definiert werden. Damit ähnlich wie bei dem `techproducts`-Tutorial eine freie Texteingabe möglich wird, definieren wir eine Kopieranweisung aller Werte \(`*`\) in das Standard-Feld \(`_text_`\).

* Button "Add Copy Field" drücken
* source: `*`
* destination: `_text_`

## Neuindexierung

Damit die Änderungen wirksam werden, müssen wir die Daten erneut indexieren.

Schritt 1: Index leeren:

```
curl "http://localhost:8983/solr/htw/update?commit=true" -H "Content-Type: text/xml" --data-binary '<delete><query>*:*</query></delete>'
```

Schritt 2: `einstein.tsv` indexieren \(hier mit Mehrfachbelegungen\):

```
curl "http://localhost:8983/solr/htw/update/csv?commit=true&separator=%09&split=true&f.contributor.separator=%E2%90%9F&f.coverage.separator=%E2%90%9F&f.creator.separator=%E2%90%9F&f.date.separator=%E2%90%9F&f.description.separator=%E2%90%9F&f.extent.separator=%E2%90%9F&f.format.separator=%E2%90%9F&f.identifier.separator=%E2%90%9F&f.language.separator=%E2%90%9F&f.pages.separator=%E2%90%9F&f.publisher.separator=%E2%90%9F&f.title.separator=%E2%90%9F&f.type.separator=%E2%90%9F" --data-binary @- -H 'Content-type:text/plain; charset=utf-8' < ~/Downloads/einstein.tsv
```

## Literatur

* [Exercise 2: Modify the Schema and Index Films Data \(im Solr Tutorial\)](http://lucene.apache.org/solr/guide/7_1/solr-tutorial.html#exercise-2)
* [Einführungsartikel zu "Managed Schema"](https://support.lucidworks.com/hc/en-us/articles/221618187-What-is-Managed-Schema-)
* [Einführungsartikel zur Definition von Feldern im Schema](http://www.solrtutorial.com/schema-xml.html)
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00			`# 4.4 Konfiguration des Solr Schemas`

Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			`Ab Solr Version 6.0 ist das sogenannte "managed schema" \(auch "schemaless mode" genannt\) voreingestellt. Solr analysiert bei der Indexierung die Daten und versucht das Schema selbst zu generieren. Felder können aber weiterhin zusätzlich manuell definiert werden.`
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00
			`## Schema über Admin-Oberfläche konfigurieren`

Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			`* Admin-Oberfläche aufrufen. Im Menü "Core Selector" den Index "htw" auswählen. Dann im zweiten Menü "Schema" aufrufen. Direktlink: [http://localhost:8983/solr/\#/htw/schema](http://localhost:8983/solr/#/htw/schema)`
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00			`* Button "Add Field" drücken`
Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			`* Name eingeben \(Groß- und Kleinschreibung ist wichtig\)`
			* `field type` \(z.B. string\) auswählen
			* ggf. die Checkbox `multivalued` markieren, wenn das Feld mehrere Werte \(getrennt durch ein Trennzeichen\) enthält
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00
			`## "Catchall" Copy Field anlegen`

Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			In der Standardkonfiguration gibt es keine übergreifende Suche. Im [Query-Interface](http://localhost:8983/solr/#/htw/query) und in der [integrierten Suchoberfläche](http://localhost:8983/solr/techproducts/browse) müsste stets ein Feld bei der Suche definiert werden. Damit ähnlich wie bei dem `techproducts`-Tutorial eine freie Texteingabe möglich wird, definieren wir eine Kopieranweisung aller Werte \(`*`\) in das Standard-Feld \(`_text_`\).
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00
			`* Button "Add Copy Field" drücken`
			* source: `*`
			* destination: `_text_`

			`## Neuindexierung`

			`Damit die Änderungen wirksam werden, müssen wir die Daten erneut indexieren.`

			`Schritt 1: Index leeren:`

			```
Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			`curl "http://localhost:8983/solr/htw/update?commit=true" -H "Content-Type: text/xml" --data-binary '<delete><query>:</query></delete>'`
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00			```

Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:56:34 +01:00			Schritt 2: `einstein.tsv` indexieren \(hier mit Mehrfachbelegungen\):
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00
			```
Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:56:34 +01:00			curl "http://localhost:8983/solr/htw/update/csv?commit=true&separator=%09&split=true&f.contributor.separator=%E2%90%9F&f.coverage.separator=%E2%90%9F&f.creator.separator=%E2%90%9F&f.date.separator=%E2%90%9F&f.description.separator=%E2%90%9F&f.extent.separator=%E2%90%9F&f.format.separator=%E2%90%9F&f.identifier.separator=%E2%90%9F&f.language.separator=%E2%90%9F&f.pages.separator=%E2%90%9F&f.publisher.separator=%E2%90%9F&f.title.separator=%E2%90%9F&f.type.separator=%E2%90%9F" --data-binary @- -H 'Content-type:text/plain; charset=utf-8' < ~/Downloads/einstein.tsv
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00			```

			`## Literatur`

Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00			`* [Exercise 2: Modify the Schema and Index Films Data \(im Solr Tutorial\)](http://lucene.apache.org/solr/guide/7_1/solr-tutorial.html#exercise-2)`
Kapitel 4 für 16.11.2017 ergänzt 2017-11-15 22:46:57 +01:00			`* [Einführungsartikel zu "Managed Schema"](https://support.lucidworks.com/hc/en-us/articles/221618187-What-is-Managed-Schema-)`
			`* [Einführungsartikel zur Definition von Feldern im Schema](http://www.solrtutorial.com/schema-xml.html)`
Updates kapitel-4/44-konfiguration-des-schemas.md Auto commit by GitBook Editor 2017-11-16 15:08:31 +01:00