Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung.

Ähnliche Präsentationen


Präsentation zum Thema: "Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung."—  Präsentation transkript:

1 Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung

2 Netzwerke Netzwerke verbinden Computer untereinander. Vereinbarungen für den Informationstransport und -Austausch nennt man Protokolle. Netzwerke werden nach dem OSI Referenzmodell in 7 Schichten eingeteilt. Dabei nimmt die unterste Schicht großen Einfluß auf die Leistungsdaten eines Netzwerkes.

3

4

5 Netzwerke In einem lokalen physikalischen Netzwerk erkennen sich die Teilnehmer mittels der MAC-Adresse (Media Access Control (Schicht 2 des OSI Referenz Modells)) der Netzwerk Karte (arp –a unter Windows). Die Abbildung in die uns bekannte IP- Adresse geschieht mittels des Adress Resolution Protokolls (ARP)

6 IP-Netzwerkadressen Eine IP-Adresse besteht aus 4 Zahlen zwischen 0 und 255. Die Netzwerkmaske (z.B x.x) bestimmt den Netzwerkteil und den Knotenteil. Die höchste und die niedrigste Knotenadresse ist jeweils für Broadcasts reserviert. Alle Rechner im Netzwerk lauschen auf den Broadcast-Adressen.

7 IP-Netzwerke Ip-Netz Broadcast 0 & 255 Maske oder / IP-Binär Maske Daher können sich Rechner mit den IP-Adressen bis in einem lokalen Netzwerk sehen.

8 Befehle um die Netzwerkkonfiguration zu sehen ipconfig Windows-IP-Konfiguration Ethernetadapter Drahtlose Netzwerkverbindung: Medienstatus : Es besteht keine Verbindung Ethernetadapter LAN-Verbindung: Verbindungsspezifisches DNS-Suffix: meb.uni-bonn.de IP-Adresse : Subnetzmaske : Standardgateway :

9 Befehle um die Netzwerkkonfiguration zu sehen netstat -a Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status TCP Quade-T60:epmap Quade-T60:0 ABHÖREN TCP Quade-T60:microsoft-ds Quade-T60:0 ABHÖREN TCP Quade-T60:2869 Quade-T60:0 ABHÖREN TCP Quade-T60:5800 Quade-T60:0 ABHÖREN TCP Quade-T60:5900 Quade-T60:0 ABHÖREN TCP Quade-T60:6060 Quade-T60:0 ABHÖREN TCP Quade-T60:10243 Quade-T60:0 ABHÖREN TCP Quade-T60:31038 Quade-T60:0 ABHÖREN TCP Quade-T60:1036 Quade-T60:0 ABHÖREN TCP Quade-T60:1090 localhost:27015 HERGESTELLT TCP Quade-T60:1168 localhost:1169 HERGESTELLT TCP Quade-T60:1169 localhost:1168 HERGESTELLT

10 Befehle um die Netzwerkkonfiguration zu sehen netstat -b Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status PID TCP Quade-T60:1090 localhost:27015 HERGESTELLT 6020 [iTunesHelper.exe] TCP Quade-T60:3289 localhost:3290 HERGESTELLT 6108 [Netscp.exe] TCP Quade-T60:3290 localhost:3289 HERGESTELLT 6108 [Netscp.exe] TCP Quade-T60:4844 localhost:4845 HERGESTELLT 5016 [firefox.exe] TCP Quade-T60:4845 localhost:4844 HERGESTELLT 5016 [firefox.exe] TCP Quade-T60:4847 localhost:4848 HERGESTELLT 5016 [firefox.exe] TCP Quade-T60:4848 localhost:4847 HERGESTELLT 5016 [firefox.exe] TCP Quade-T60:27015 localhost:1090 HERGESTELLT 712 [AppleMobileDeviceService.exe] TCP Quade-T60:5152 localhost:1088 SCHLIESSEN_WARTEN 3004 [jqs.exe]

11 Befehle um die Netzwerkkonfiguration zu sehen netstat -ano Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status PID TCP : :0 ABHÖREN 7128 TCP : :0 ABHÖREN 552 TCP : :0 ABHÖREN 4 TCP : :0 ABHÖREN 1076 TCP : :0 ABHÖREN 2808 TCP : :0 ABHÖREN 2808 TCP : :0 ABHÖREN 684 TCP : :0 ABHÖREN 2632 TCP : :0 ABHÖREN 2024 TCP : :0 ABHÖREN 1912

12 Befehle um die Netzwerkkonfiguration zu sehen arp -a Address HWtype HWaddress Flags Mask iface ether 00:16:3e:57:90:23 C br0 ether 00:16:3e:57:90:23 C br0 linkdb.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0 famhap.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0 www-dom0.meb.uni-bonn.d ether 00:15:17:ab:ae:fe C br0 nmap /24 Interesting ports on Jumbo-dom0.meb.uni-bonn.de ( ): Not shown: 998 closed ports PORT STATE SERVICE 22/tcp open ssh 111/tcp open rpcbind MAC Address: 00:30:48:20:0C:D4 (Supermicro Computer)

13 IP-Netzwerkklassen Eine IP-Adresse ist zweigeteilt und zwar in einen Netzwerkteil und einen Knotenteil. Der Netzwerkteil ist innerhalb eines Netzwerksegments überall gleich, während jeder Rechner oder jedes andere Gerät seine eigene Knotennummer bekommt Maske

14 IP-Netzwerkklassen Über die Netzwerknummer erfolgt auch die Einteilung in sogenannte Netzwerk-Klassen in A-, B- oder C-Klasse Netzwerke. Das Prinzip ist, dass große Netzwerke mit vielen Knoten möglichst eine Klasse A oder wenigstens eine Klasse B Nummer bekommen und kleine Netze eine Klasse C Nummer

15 IP-Netzwerkklassen Klasse A ( bis ): Das erste Bit der Adresse ist auf Null gesetzt. Die ersten acht Bit identifizieren das Netzwerk, die restlichen 24 Bit den Host. Insgesamt sind 127 Class-A-Netze möglich. Reserviert: 127.x.x.x (loopback/localhost) Privat: Maske: oder/8

16 IP-Netzwerkklassen Das Klasse B ( bis ): Bei Klasse-B-Netzen ist das erste Bit auf Null, das zweite Bit auf eins gesetzt. Die ersten 16 Bit beschreiben das Netzwerk, die anderen 16 Bit sind die Hostadresse. Netze: mit maximal angeschlossenen Computern. Privat: Maske oder /16

17 IP-Netzwerkklassen Klasse C ( bis ) : Diese Netzwerkart erlaubt nur 255 Hosts in einem Netz. Die ersten drei Bit einer Class-C-Adresse bilden dabei die Folge "110". Die ersten 24 Bit identifizieren das Netzwerk, nur acht Bit den Host Netze mit jeweils 254 Rechnern Privat: Mask oder /24

18 IP-Netzwerkklassen Klasse D: für spezielle Dienste z.B. Multicast

19 Ports Jede IP-Adresse hat Ports festgelegte privilegierte Ports 0 bis festgelegte Ports von 1024 bis dynamische oder private von bis numbers numbers

20 Firewall Die Firewall legt fest, ob eine Verbindung erlaubt ist. Die Firewall kontrolliert eingehende, weitergeleitete und ausgehende Pakete. Die Firewall kann berücksichtigen, ob Pakete zu einer bereits bestehenden Verbindung gehören.

21 Firewall iptables -A INPUT -i eth0 -p ICMP -j ACCEPT iptables -A OUTPUT -o eth0 -p ICMP -j DROP

22 Router Ein router leitet Pakete aktiv von einem Netzwerk in ein anderes. Dabei können die Pakete (z.B. IP-Adresse) auch verändert werden.

23 Switch Ein switch verbindet Netzwerksegmente oder Rechner miteinander. Dabei können auch mehrere Rechner in virtuellen Netzwerken (vlan) zusammengefasst werden.

24 Historie Einzelne Inseln Jeder vertaut Jedem (frühes Internet) Internet Company B Company A Router

25 Weitere Entwicklung Filtern & Firewalls demilitarisierte Zonen Internet Company A Firewall Router Internet Firewall Router Company A DMZ Company A Internal Network WWW Server DNS Server SMTP Relay

26 Sichere Architektur Virtuelle Gemeinschaft (Extranets & B2B VPNs) –Site-to-site VPN tunnel –Vernetzung mit Praxen

27 und weiter … Virtuell mobile Arbeitsweise (C2B VPNs) –Zunehmend schneller Internetzugang –Firewalls mit VPN-Funktionalität –Dedizierte VPN-Konzentratoren machen den Zugang für mobile Arbeitsplätze von der Firewall unabhängig

28 Begriffe html:Hypertext Markup Language Transfer Protocol

29 HTML Bearbeitung

30 Logfiles & Cookies LogFormat "%h %l %u %t \"%r\" %s %b %T %{Cookie}n \ \"%{Referer}i\" \"%{User-Agent}i\" \"%{UNIQUE_ID}e\""

31 Statistiken zentral Statistiken CancerNet

32 A A+B AA+C RecallAnteil der gefundenen Daten an den gesuchten Daten Precision Anteil der gefundenen Daten der von Interesse ist Ergebnis der Suche vorhandene Daten relevant irrelevant gefunden nicht gefunden ABABCDCDABABCDCD Recherchesysteme

33 Recherchesysteme MEDLINESchlagworte, Autoren (3000 journals) CURRENTwöchentlich erstelltes lnhaltsverzeichnis CONTENTS wichtiger Journals SCIENCE wie häufig wurde eine Publikation zitiert CITATION INDEX

34 Zwei Verfahren der Indexierung Einfacher Index über alle Worte z.B. WAIS Index mit Thesaurus z.B. Xindex mit UMLS-Metathesaurus Alle Worte werden in den Index aufgenommen Auch Worte wie Ich, Du, Er, Sie, Es, Das, und, aber, wie,... Keine Bestimmung von Häufigkeit und Wichtigkeit Es werden nur relevante Begriffe in den Index aufgenommen Was Relevant ist wird an Hand von UMLS bestimmt Berechnung der Häufigkeiten von Worten und Wortgruppen Berechnung der Dichte dieser Worte und Wortgruppen

35 Funktion von Xindex mit UMLS-Metathesaurus Wortliste UMLS-Metathesaurus Dokument Primäre Wortliste (Konzepte) Ranking Rank = Wörter pro Begriff * Anzahl * 1/Doclen * 1/Anz. Häufigster Begriff Index für das Dokument mit Preffered Terms

36 Vorteile von Xindex gegenüber dem Standard Erkennen von Wortkombinationen z.B. Breast Cancer Gleiches Suchergebnis bei unterschielicher Schreibweise z.B. hpv und HPV z.B. MTX und Methotrexat Sinnvolles Suchergebnis bei trivialen Begriffen z.B. love -->HPV, Cervixcarzinom, Brustkrebs Es werden Dokumente in verschiedenen Sprachen gefunden z.B. Englisch, Deutsch und Spanisch

37 Vorteile von Xindex gegenüber WAIS Beispiel Melanom

38 Vorteile von Xindex Es werden seltene Entitäten gefunden: Suche nach Melanom liefert Informationen zum Wilms Tumor Dieser steht in Verbindung zum clearcellsarcoma einer seltenen Form des Melanoms Erkennen von Synonymen z.B. Mumps, Parotitis epidemica

39 Der UMLS-Metathesaurus Integration vorhandener Thesaurie: ICD 10, MESH, Cancerlit, HL7-Zusatz Mehrsprachig: z.B. Englisch, Deutsch, Spanisch, Russisch, Französisch, Finnisch, Italienisch,... Konzeptorientierung: Jedes Konzept bekommt eine Nummer (CUI) Jedes Synonym jedes Konzeptes bekommt eine eigene Nummer in verschiedenen Sprachen sowohl normalisiert (SUI) als auch nicht normalisiert (LUI) Kennzeichnung des Preffered Terms

40 Nutzerprobleme Wie finde ich als Laie eine Information?Wie finde ich als Laie eine Information? Wie kann ich die Seriosität einer Information erkennen (weit mehr fragliche Informationen denn gute) ?Wie kann ich die Seriosität einer Information erkennen (weit mehr fragliche Informationen denn gute) ? Wie finde ich beim Anbieter eine Information trotz bildorientierter Oberfläche?Wie finde ich beim Anbieter eine Information trotz bildorientierter Oberfläche?

41 Was man wissen sollte! Suchmaschinen lesen über Spider Dokumente ein und erstellen einen Volltext-Index (nicht bei Datenbanken, Graphiken, Java).Suchmaschinen lesen über Spider Dokumente ein und erstellen einen Volltext-Index (nicht bei Datenbanken, Graphiken, Java). Metatags werden nur bedingt ausgewertet. (Anbieter manipulieren auf Teufel komm raus)Metatags werden nur bedingt ausgewertet. (Anbieter manipulieren auf Teufel komm raus) Ranking ist nicht intelligent und bevorzugt kurze Dokumente.Ranking ist nicht intelligent und bevorzugt kurze Dokumente. Für Geld wird das Ranking manipuliert!Für Geld wird das Ranking manipuliert!

42 Universität Bonn Vermittlung zu CancerNet Host=Lycos Januar März Mai 1997 Januar März Mai a2z Katalog wurde am 28. März aus dem Angebot genommen

43 Meta-Tags CONTENT="Breast cancer, oncology, Cancer, medicine, Medizin, Krebs, CancerNet, PDQ, Tumor">

44 Qualitätssiegel Geschütztes Logo einer anerkannten Organisation (NCI)Geschütztes Logo einer anerkannten Organisation (NCI) HON Code of ConductHON Code of Conduct Link von einer anerkannten Organisation (WHO)Link von einer anerkannten Organisation (WHO) MedCERTAINMedCERTAIN

45 Evaluation kommerzieller Anbieter Kriterien für Focus RechercheKriterien für Focus Recherche –Nutzen für den User –Kostensenkung durch weniger Arztbesuche –Richtigkeit und Ausgewogenheit –Vollständigkeit –Online-Arzt vorhanden

46 Ergebnis der Recherche für FocusErgebnis der Recherche für Focus –Der User kann einen Arzt finden. Ein Hausarzt-Buch ist auf mehrere Tausend Pages aufgeteilt. –Der User verbringt viel Zeit für wenig Information im Netz. Seiten werden aus Datenbank generiert. Viele Wege führen zur gleichen Seite. –Bachblüten und Standardtherapie gleichwertig im Angebot. –Nur Infos vom eigenen Server. Suche extrem schwierig (Stunden) da Information versteckt. –Online-Arzt ist nicht hilfreich für eigene Fragen (Show).

47 Was will der Nutzer? Informationen zu KrankheitenInformationen zu Krankheiten Informationen zu eigenen WertenInformationen zu eigenen Werten Zugriff auf die eigene PatientenakteZugriff auf die eigene Patientenakte Informationen zu Arzt, Krankenhaus oder VersicherungInformationen zu Arzt, Krankenhaus oder VersicherungKrankenhaus –Sprechstunden, Besuchszeiten, Parkplatz –Benchmarking im Qualitätsbereich Link Benchmarking im QualitätsbereichLinkBenchmarking im QualitätsbereichLink –Versicherungsvergleich

48 Aufbau von Suchmaschinen Spider / Crawler (robot.txt) Indexer Broker (Schnittstelle zum Benutzer)

49 Spider / Crawler Nur ein Teil des WWW-Bereichs wird von einem Crawler erfaßt. Häufig werden Links nicht weiterverfolgt bei: dynamisch gestalteten Webseiten, Frames, Java und Bildern.

50 robots.txt User-agent: * Disallow: /usage/ Disallow: /dimdi/ Disallow: /standard/ Disallow: /standards/HL7/ Disallow: /niedergel/ Disallow: /epileptologie/epi_info/physicians/

51 Benutzerschnittstelle Basic Search: +,- Groß/klein Schreibung Wildcards: * Phrasen in Hochkommata Advanced Search: Boolsche Algebra: AND, OR, XOR, NOT, NEAR

52 Beispiel: AltaVista gmds:GMDS: gmds konferenz: +gmds konferenz: +gmds +konferenz: gmds konferenz: 2943 Dokumente 1418 Dokumente Dokumente 2955 Dokumente 62 Dokumente 0 Dokumente

53 Ranking Schlüsselwortdichte (Benachteiligung ausführlicher Dokumente) Meta-Tags (oft manipuliert) Link Popularity(science citation index) Verkauf von Ranking-Prioritäten statt Werbung Neuere Ansätze

54 Aktualität Anzahl der Dokumente überschreitet die Kapazität der Suchmaschinen Scannen der Dokumente in mehrmonatlichen Abständen Zulassen mehrerer no connection für bereits indexierte Dokumente Keine Strafen für tote Links in Dokumenten

55 Verzeichnisse Qualität der Bewertung liegt allein bei dem Redaktionsteam Nur wenige Dokumente können erfaßt werden Großer finanzieller Anreiz zur Manipulation

56 Benutzerschnittstelle


Herunterladen ppt "Medizinische Statistik und Informationsverarbeitung Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung."

Ähnliche Präsentationen


Google-Anzeigen