Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- project:wwwcccde [02.01.2014 19:17] – [Suchmaschine] kernelpanic
+++ project:wwwcccde [06.03.2015 21:51] (aktuell) – [Data-Entry] laura
@@ Zeile 1: / Zeile 1: @@
+====== www.ccc.de ======
 Dieses Projekt hat zum Ziel, eine neue technische Basis für www.ccc.de zu schaffen. Dabei soll die Useability für Leute, die den Content auf ccc.de zur Verfügung stellen, verbessert werden - nur so kann entsprechend bequem und schlagkräftig agiert werden.
 ====== Organisatorisches ======
   * **Mailingliste**: ccc-tf@lists.chaos-inkl.de
-  * **Zeitplanung**:
-^ Datum             ^ Was?       ^
-| 6. Sept. (MRMCD)  | Wordpress mit Plugins fertig, Content teilweise migriert |
-| 30. Sept.         | Content komplett migriert |
-| Mitte Oktober     | Theme getüdelt und integriert |
-| Ende Oktober      | Release |
   * **Termine**
     * Erstes Treffen: Samstag, den 27.7. ab 11 Uhr im Raum. Zielsetzung:
@@ Zeile 49: / Zeile 43: @@
   - Aufteilung in Teams:
     - Content-Migration: Ein paar Leute kopieren den Content von ccc.de und dasalte.ccc.de in das Testsystem; manuell. Dabei müssen die URLs erhalten bleiben, die Tags etc. auch.
-    - HTML&CSS-Magic: Ein neues Gesicht für ccc.de. Grafiknerd fehlt gerade.
+    - HTML&CSS-Magic: Ein neues Gesicht für ccc.de. https://gitorious.org/ccc-theme-markup
   - Betatest. Hier wird das Testsystem einem größeren Personenkreis zugänglich gemacht, ggf. auftretende Fuckups müssen diskutiert werden.
   - Rollout - ggf. auf der bereits bestehenden Infrastruktur.
@@ Zeile 57: / Zeile 51: @@
 Howto: [[project:wwwcccde:migration]]
+======= Setup der Webseite =======
+Howto: [[project:wwwcccde:setup]]
 ====== Suchmaschine =====
-Als Suchmaschine bietet sich Apache Solr (Engine) mit Nutch (Crawler) an, wobei die Skalierung auch bei extremen Größenordnungen noch gegeben ist. Dynamischer Content wird auch indiziert, wobei es wie auch bei Google gewisse Einschränkungen gibt. robotx.txt Files werden beachtet. Ein Prototyp ensteht unter http://search.c3events.de (ist aktuell nur zweitweise online) wobei Crawler, Engine und Frontend auf der gleichen Maschine laufen. Indiziert wird derzeit nur der Content von https://www.cccmz.de um zu sehen, was z.B. bei Wordpress heraus kommt. Das Frontend für die User wird in PHP erstellt, weil es einfach sein soll. Solr wird vom PHP in Form eines Webservices angesprochen, wobei Solr die Suchresultate in JSON oder XML liefern kann. Die Suche erlaubt die ANgabe von Parametern.
+Als Suchmaschine bietet sich Apache Solr (Engine) mit Nutch (Crawler) an, wobei die Skalierung auch bei extremen Größenordnungen noch gegeben ist. Dynamischer Content wird auch indiziert, wobei es wie auch bei Google gewisse Einschränkungen gibt. robotx.txt Files werden beachtet. Ein Prototyp ensteht unter https://search.c3event.de (ist aktuell nur zweitweise online) wobei Crawler, Engine und Frontend auf der gleichen Maschine laufen. Indiziert wird derzeit nur der Content von https://www.cccmz.de um zu sehen, was z.B. bei Wordpress heraus kommt. Das Frontend für die User wird in PHP erstellt, weil es einfach sein soll. Solr wird vom PHP in Form eines Webservices angesprochen, wobei Solr die Suchresultate in JSON oder XML liefern kann. Die Suche erlaubt die ANgabe von Parametern.
 **Zugangsdaten search.c3event.de**
+//Kann zeitweise offline sein//
 Username: ccc
@@ Zeile 75: / Zeile 73: @@
   * Die Suche kann auch von verschiedenen Erfas genutzt werden, so könnten die Webangebote der verschienen Erfas zentral indiziert werden
   * Der Crawler ist nicht nur auf http(s) beschränkt
-  * Nutzung von Cloudflare bei stakren Lastsitualtionen? (z.B. XXC3)
+  * Nutzung von Cloudflare bei besonderen Lastsituationen? (z.B. XXC3)
   * Je nach Umfang des Webauftritts sehr hohe Speicheranforderungen (Apache Hadoop lässt grüßen)
   * Die Qualität der Suche kann sich sehen lassen, bleibt noch abzuwarten, was der mit PDF oder OpenOffice Files macht. Microsoft Office mag er offenbar nicht -> Wird nicht indiziert.
   * Der Crawler benötigt noch einiges Tuning (Speicherlast vs. Speed)
+  * Probleme beim Compilieren von OpenJDK unter FreeBSD, daher Testsystem zunächst auf Debian Linux implementiert, der Webservice kann natürlich auch von FreeBSD aus benutzt werden
 **Userinterface**
@@ Zeile 84: / Zeile 83: @@
 KISS (Keep It Stupid and Simple) erlaubt nicht nur eine einfache Integration, sondern Sicherheitsprobleme werden auch offensichtlicher und lassen sich leichter finden/beheben. Die Wahl ist dafür auf PHP gefallen, weil sich das dann leichter in Wordpress oder andere Tools einbauen lässt. Also nicht wundern, wenn das aussieht wie ein Webauftritt aus den 1990er Jahren.
-**Wordpress**
+Wenn für unseren neuen Webauftritt ein passendes SOLR Schema gefunden ist, dann wären noch Fragen zum Search GUI zu klären, wobei grundsätzlich folgende Wege möglich sind:
+    - Direkter Zugriff mit XML über den Webservice? Vorteil: Kann jederzeit geändert werden. Die XML Antwort muss jedoch über ein XSLT in HTML umgewandelt werden.
+    - Eigener Tomcat/Jboss oder Glassfish Server. Skaliert sehr gut, aber dicker Footprint im Speicher
+    - @Erfas: Eigener Crawler oder vom CCC Crawler indizieren lassen? - muss jeder Erfa für sich entscheiden, robots.txt nicht vergessen.
+**Updates**
+  * 10.01.2014: Suggestion Funktion auf Server läuft, jedoch Userfrontend muss das zu Fuß über XML machen
-Da gibt es auch ein Plugin für Apache Solr: http://wordpress.org/plugins/advanced-search-by-my-solr-server/
@@ Zeile 96: / Zeile 105: @@
   * Multilanguage-Support
   * ... siehe Etherpad (vorerst)
+  * Zertifikate: Weiterhin CAcert oder StartSSL?
+==== Metadaten ====
+---- dataentry projekt ----
+name          : www.ccc.de
+contact       : paalsteek
+tags_tags     :
+type          : projekt
+subtype       : technisch
+sticky_hidden : no
+----