Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen RevisionVorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
project:wwwcccde [03.01.2014 05:36] – [Suchmaschine] kernelpanicproject:wwwcccde [06.03.2015 21:51] (aktuell) – [Data-Entry] laura
Zeile 1: Zeile 1:
 +====== www.ccc.de ======
 +
 Dieses Projekt hat zum Ziel, eine neue technische Basis für www.ccc.de zu schaffen. Dabei soll die Useability für Leute, die den Content auf ccc.de zur Verfügung stellen, verbessert werden - nur so kann entsprechend bequem und schlagkräftig agiert werden. Dieses Projekt hat zum Ziel, eine neue technische Basis für www.ccc.de zu schaffen. Dabei soll die Useability für Leute, die den Content auf ccc.de zur Verfügung stellen, verbessert werden - nur so kann entsprechend bequem und schlagkräftig agiert werden.
  
 ====== Organisatorisches ====== ====== Organisatorisches ======
   * **Mailingliste**: ccc-tf@lists.chaos-inkl.de   * **Mailingliste**: ccc-tf@lists.chaos-inkl.de
-  * **Zeitplanung**: 
- 
-^ Datum             ^ Was?       ^ 
-| 6. Sept. (MRMCD)  | Wordpress mit Plugins fertig, Content teilweise migriert | 
-| 30. Sept.         | Content komplett migriert | 
-| Mitte Oktober     | Theme getüdelt und integriert | 
-| Ende Oktober      | Release | 
- 
   * **Termine**   * **Termine**
     * Erstes Treffen: Samstag, den 27.7. ab 11 Uhr im Raum. Zielsetzung:      * Erstes Treffen: Samstag, den 27.7. ab 11 Uhr im Raum. Zielsetzung: 
Zeile 49: Zeile 43:
   - Aufteilung in Teams:   - Aufteilung in Teams:
     - Content-Migration: Ein paar Leute kopieren den Content von ccc.de und dasalte.ccc.de in das Testsystem; manuell. Dabei müssen die URLs erhalten bleiben, die Tags etc. auch.     - Content-Migration: Ein paar Leute kopieren den Content von ccc.de und dasalte.ccc.de in das Testsystem; manuell. Dabei müssen die URLs erhalten bleiben, die Tags etc. auch.
-    - HTML&CSS-Magic: Ein neues Gesicht für ccc.de. Grafiknerd fehlt gerade.+    - HTML&CSS-Magic: Ein neues Gesicht für ccc.de. https://gitorious.org/ccc-theme-markup
   - Betatest. Hier wird das Testsystem einem größeren Personenkreis zugänglich gemacht, ggf. auftretende Fuckups müssen diskutiert werden.    - Betatest. Hier wird das Testsystem einem größeren Personenkreis zugänglich gemacht, ggf. auftretende Fuckups müssen diskutiert werden. 
   - Rollout - ggf. auf der bereits bestehenden Infrastruktur.   - Rollout - ggf. auf der bereits bestehenden Infrastruktur.
Zeile 57: Zeile 51:
 Howto: [[project:wwwcccde:migration]] Howto: [[project:wwwcccde:migration]]
  
 +======= Setup der Webseite =======
 +Howto: [[project:wwwcccde:setup]]
  
  
 ====== Suchmaschine ===== ====== Suchmaschine =====
  
-Als Suchmaschine bietet sich Apache Solr (Engine) mit Nutch (Crawler) an, wobei die Skalierung auch bei extremen Größenordnungen noch gegeben ist. Dynamischer Content wird auch indiziert, wobei es wie auch bei Google gewisse Einschränkungen gibt. robotx.txt Files werden beachtet. Ein Prototyp ensteht unter https://search.c3events.de (ist aktuell nur zweitweise online) wobei Crawler, Engine und Frontend auf der gleichen Maschine laufen. Indiziert wird derzeit nur der Content von https://www.cccmz.de um zu sehen, was z.B. bei Wordpress heraus kommt. Das Frontend für die User wird in PHP erstellt, weil es einfach sein soll. Solr wird vom PHP in Form eines Webservices angesprochen, wobei Solr die Suchresultate in JSON oder XML liefern kann. Die Suche erlaubt die ANgabe von Parametern.+Als Suchmaschine bietet sich Apache Solr (Engine) mit Nutch (Crawler) an, wobei die Skalierung auch bei extremen Größenordnungen noch gegeben ist. Dynamischer Content wird auch indiziert, wobei es wie auch bei Google gewisse Einschränkungen gibt. robotx.txt Files werden beachtet. Ein Prototyp ensteht unter https://search.c3event.de (ist aktuell nur zweitweise online) wobei Crawler, Engine und Frontend auf der gleichen Maschine laufen. Indiziert wird derzeit nur der Content von https://www.cccmz.de um zu sehen, was z.B. bei Wordpress heraus kommt. Das Frontend für die User wird in PHP erstellt, weil es einfach sein soll. Solr wird vom PHP in Form eines Webservices angesprochen, wobei Solr die Suchresultate in JSON oder XML liefern kann. Die Suche erlaubt die ANgabe von Parametern.
  
 **Zugangsdaten search.c3event.de** **Zugangsdaten search.c3event.de**
 +
 +//Kann zeitweise offline sein//
  
 Username: ccc Username: ccc
Zeile 79: Zeile 77:
   * Die Qualität der Suche kann sich sehen lassen, bleibt noch abzuwarten, was der mit PDF oder OpenOffice Files macht. Microsoft Office mag er offenbar nicht -> Wird nicht indiziert.   * Die Qualität der Suche kann sich sehen lassen, bleibt noch abzuwarten, was der mit PDF oder OpenOffice Files macht. Microsoft Office mag er offenbar nicht -> Wird nicht indiziert.
   * Der Crawler benötigt noch einiges Tuning (Speicherlast vs. Speed)   * Der Crawler benötigt noch einiges Tuning (Speicherlast vs. Speed)
-  * Probleme beim compilieren von OpenJDK unter FreeBSD, daher Testsystem zunächst auf Debian Linux implementiert, der Webservice kann natürlich auch von FreeBSD aus benutzt werden+  * Probleme beim Compilieren von OpenJDK unter FreeBSD, daher Testsystem zunächst auf Debian Linux implementiert, der Webservice kann natürlich auch von FreeBSD aus benutzt werden
  
 **Userinterface** **Userinterface**
Zeile 85: Zeile 83:
 KISS (Keep It Stupid and Simple) erlaubt nicht nur eine einfache Integration, sondern Sicherheitsprobleme werden auch offensichtlicher und lassen sich leichter finden/beheben. Die Wahl ist dafür auf PHP gefallen, weil sich das dann leichter in Wordpress oder andere Tools einbauen lässt. Also nicht wundern, wenn das aussieht wie ein Webauftritt aus den 1990er Jahren. KISS (Keep It Stupid and Simple) erlaubt nicht nur eine einfache Integration, sondern Sicherheitsprobleme werden auch offensichtlicher und lassen sich leichter finden/beheben. Die Wahl ist dafür auf PHP gefallen, weil sich das dann leichter in Wordpress oder andere Tools einbauen lässt. Also nicht wundern, wenn das aussieht wie ein Webauftritt aus den 1990er Jahren.
  
-**Wordpress**+Wenn für unseren neuen Webauftritt ein passendes SOLR Schema gefunden ist, dann wären noch Fragen zum Search GUI zu klären, wobei grundsätzlich folgende Wege möglich sind: 
 + 
 +    - Direkter Zugriff mit XML über den Webservice? Vorteil: Kann jederzeit geändert werden. Die XML Antwort muss jedoch über ein XSLT in HTML umgewandelt werden. 
 +    - Eigener Tomcat/Jboss oder Glassfish Server. Skaliert sehr gut, aber dicker Footprint im Speicher 
 +    - @Erfas: Eigener Crawler oder vom CCC Crawler indizieren lassen? - muss jeder Erfa für sich entscheiden, robots.txt nicht vergessen. 
 + 
 + 
 + 
 +**Updates** 
 + 
 +  * 10.01.2014: Suggestion Funktion auf Server läuft, jedoch Userfrontend muss das zu Fuß über XML machen 
  
-Da gibt es auch ein Plugin für Apache Solr: http://wordpress.org/plugins/advanced-search-by-my-solr-server/ 
  
  
Zeile 97: Zeile 105:
   * Multilanguage-Support   * Multilanguage-Support
   * ... siehe Etherpad (vorerst)   * ... siehe Etherpad (vorerst)
 +  * Zertifikate: Weiterhin CAcert oder StartSSL?
 +
 +
 +==== Metadaten ====
 +---- dataentry projekt ----
 +name          : www.ccc.de
 +contact       : paalsteek
 +tags_tags     : 
 +type          : projekt
 +subtype       : technisch
 +sticky_hidden : no
 +----
  
project/wwwcccde.1388727398.txt.gz · Zuletzt geändert: 03.01.2014 05:36 von kernelpanic
Falls nicht anders bezeichnet, ist der Inhalt dieses Wikis unter der folgenden Lizenz veröffentlicht: CC Attribution-Noncommercial-Share Alike 4.0 International
Recent changes RSS feed Driven by DokuWiki