Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Medizinische Statistik und Informationsverarbeitung

Ähnliche Präsentationen


Präsentation zum Thema: "Medizinische Statistik und Informationsverarbeitung"—  Präsentation transkript:

1 Medizinische Statistik und Informationsverarbeitung
Quade Institut für Medizinische Statistik, Dokumentation und Datenverarbeitung Quade

2 Netzwerke Netzwerke verbinden Computer untereinander.
Vereinbarungen für den Informationstransport und -Austausch nennt man Protokolle. Netzwerke werden nach dem OSI Referenzmodell in 7 Schichten eingeteilt. Dabei nimmt die unterste Schicht großen Einfluß auf die Leistungsdaten eines Netzwerkes. Quade

3

4 Quade

5 Netzwerke In einem lokalen physikalischen Netzwerk erkennen sich die Teilnehmer mittels der MAC-Adresse (Media Access Control (Schicht 2 des OSI Referenz Modells)) der Netzwerk Karte (arp –a unter Windows). Die Abbildung in die uns bekannte IP-Adresse geschieht mittels des Adress Resolution Protokolls (ARP)

6 IP-Netzwerkadressen Eine IP-Adresse besteht aus 4 Zahlen zwischen 0 und 255. Die Netzwerkmaske (z.B x.x) bestimmt den Netzwerkteil und den Knotenteil. Die höchste und die niedrigste Knotenadresse ist jeweils für Broadcasts reserviert. Alle Rechner im Netzwerk lauschen auf den Broadcast-Adressen.

7 IP-Netzwerke Ip-Netz 131.220.23.0 Broadcast 0 & 255
Maske oder /24 IP-Binär Maske Daher können sich Rechner mit den IP-Adressen bis in einem lokalen Netzwerk „sehen“.

8 Befehle um die Netzwerkkonfiguration zu sehen
ipconfig Windows-IP-Konfiguration Ethernetadapter Drahtlose Netzwerkverbindung: Medienstatus : Es besteht keine Verbindung Ethernetadapter LAN-Verbindung: Verbindungsspezifisches DNS-Suffix: meb.uni-bonn.de IP-Adresse : Subnetzmaske : Standardgateway :

9 Befehle um die Netzwerkkonfiguration zu sehen
netstat -a Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status TCP Quade-T60:epmap Quade-T60: ABHÖREN TCP Quade-T60:microsoft-ds Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: Quade-T60: ABHÖREN TCP Quade-T60: localhost: HERGESTELLT TCP Quade-T60: localhost: HERGESTELLT TCP Quade-T60: localhost: HERGESTELLT

10 Befehle um die Netzwerkkonfiguration zu sehen
netstat -b Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status PID TCP Quade-T60: localhost: HERGESTELLT [iTunesHelper.exe] TCP Quade-T60: localhost: HERGESTELLT [Netscp.exe] TCP Quade-T60: localhost: HERGESTELLT [Netscp.exe] TCP Quade-T60: localhost: HERGESTELLT [firefox.exe] TCP Quade-T60: localhost: HERGESTELLT [firefox.exe] TCP Quade-T60: localhost: HERGESTELLT [firefox.exe] TCP Quade-T60: localhost: HERGESTELLT [firefox.exe] TCP Quade-T60: localhost: HERGESTELLT [AppleMobileDeviceService.exe] TCP Quade-T60: localhost: SCHLIESSEN_WARTEN [jqs.exe]

11 Befehle um die Netzwerkkonfiguration zu sehen
netstat -ano Aktive Verbindungen Proto Lokale Adresse Remoteadresse Status PID TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN TCP : : ABHÖREN

12 Befehle um die Netzwerkkonfiguration zu sehen
arp -a Address HWtype HWaddress Flags Mask iface ether 00:16:3e:57:90:23 C br0 ether 00:16:3e:57:90:23 C br0 linkdb.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0 famhap.meb.uni-bonn.de ether 00:16:3e:35:c1:5e C br0 www-dom0.meb.uni-bonn.d ether 00:15:17:ab:ae:fe C br0 nmap /24 Interesting ports on Jumbo-dom0.meb.uni-bonn.de ( ): Not shown: 998 closed ports PORT STATE SERVICE 22/tcp open ssh 111/tcp open rpcbind MAC Address: 00:30:48:20:0C:D4 (Supermicro Computer)

13 IP-Netzwerkklassen Eine IP-Adresse ist zweigeteilt und zwar in einen Netzwerkteil und einen Knotenteil. Der Netzwerkteil ist innerhalb eines Netzwerksegments überall gleich, während jeder Rechner oder jedes andere Gerät seine eigene Knotennummer bekommt. Maske

14 IP-Netzwerkklassen Über die Netzwerknummer erfolgt auch die Einteilung in sogenannte Netzwerk-Klassen in A-, B- oder C-Klasse Netzwerke. Das Prinzip ist, dass große Netzwerke mit vielen Knoten möglichst eine Klasse A oder wenigstens eine Klasse B Nummer bekommen und kleine Netze eine Klasse C Nummer

15 IP-Netzwerkklassen Klasse A (1.0.0.0 bis 127.255.255.255):
Das erste Bit der Adresse ist auf Null gesetzt. Die ersten acht Bit identifizieren das Netzwerk, die restlichen 24 Bit den Host. Insgesamt sind 127 Class-A-Netze möglich. Reserviert: 127.x.x.x (loopback/localhost) Privat: Maske: oder /8

16 IP-Netzwerkklassen Das Klasse B (128.0.0.0 bis 191.255.255.255):
Bei Klasse-B-Netzen ist das erste Bit auf Null, das zweite Bit auf eins gesetzt. Die ersten 16 Bit beschreiben das Netzwerk, die anderen 16 Bit sind die Hostadresse. Netze: mit maximal angeschlossenen Computern. Privat: Maske oder /16

17 IP-Netzwerkklassen Klasse C (192.0.0.0 bis 223.255.255.255) :
Diese Netzwerkart erlaubt nur 255 Hosts in einem Netz. Die ersten drei Bit einer Class-C-Adresse bilden dabei die Folge "110". Die ersten 24 Bit identifizieren das Netzwerk, nur acht Bit den Host. Netze mit jeweils 254 Rechnern Privat: Mask oder /24

18 IP-Netzwerkklassen Klasse D: für spezielle Dienste z.B. Multicast

19 Ports Jede IP-Adresse hat 65536 Ports
festgelegte privilegierte Ports 0 bis 1023. festgelegte Ports von 1024 bis 49151 dynamische oder private von bis

20 Firewall Die Firewall legt fest, ob eine Verbindung erlaubt ist.
Die Firewall kontrolliert eingehende, weitergeleitete und ausgehende Pakete. Die Firewall kann berücksichtigen, ob Pakete zu einer bereits bestehenden Verbindung gehören.

21 Firewall iptables -A INPUT -i eth0 -p ICMP -j ACCEPT
iptables -A OUTPUT -o eth0 -p ICMP -j DROP

22 Router Ein router leitet Pakete aktiv von einem Netzwerk in ein anderes. Dabei können die Pakete (z.B. IP-Adresse) auch verändert werden.

23 Switch Ein switch verbindet Netzwerksegmente oder Rechner miteinander. Dabei können auch mehrere Rechner in virtuellen Netzwerken (vlan) zusammengefasst werden.

24 Historie Einzelne Inseln Jeder vertaut Jedem (frühes Internet)
Company B Company A Router

25 Weitere Entwicklung Filtern & Firewalls demilitarisierte Zonen
Internet Company A Firewall Router Internet Firewall Router Company A DMZ Internal Network WWW Server DNS Server SMTP Relay

26 Sichere Architektur Virtuelle Gemeinschaft (Extranets & B2B VPNs)
Site-to-site VPN tunnel Vernetzung mit Praxen Internet Firewall Router Company B DMZ Internal Network Extranet Company A

27 und weiter … Virtuell mobile Arbeitsweise (C2B VPNs)
Zunehmend schneller Internetzugang Firewalls mit VPN-Funktionalität Dedizierte VPN-Konzentratoren machen den Zugang für mobile Arbeitsplätze von der Firewall unabhängig Firewall w/ Tunnel Internet Router Company A DMZ Internal Network Mobiler Arbeitsplatz Telearbeit

28 Begriffe html: Hypertext Markup Language
http: Hypertext Transfer Protocol Quade

29 HTML Bearbeitung Quade

30 Logfiles & Cookies LogFormat "%h %l %u %t \"%r\" %s %b %T %{Cookie}n \
\"%{Referer}i\" \"%{User-Agent}i\" \"%{UNIQUE_ID}e\"" Quade

31 Statistiken CancerNet
Statistiken zentral Statistiken CancerNet Quade

32 Recherchesysteme Recall Anteil der gefundenen Daten an den gesuchten Daten Precision Anteil der gefundenen Daten der von Interesse ist A A+C A A+B vorhandene Daten relevant irrelevant A B C D gefunden nicht gefunden Ergebnis der Suche

33 Recherchesysteme MEDLINE Schlagworte, Autoren ( journals) CURRENT wöchentlich erstelltes lnhaltsverzeichnis CONTENTS wichtiger Journals SCIENCE wie häufig wurde eine Publikation zitiert CITATION INDEX Quade

34 Zwei Verfahren der Indexierung
Einfacher Index über alle Worte z.B. WAIS Alle Worte werden in den Index aufgenommen Auch Worte wie Ich, Du, Er, Sie, Es, Das, und, aber, wie, ... Keine Bestimmung von Häufigkeit und Wichtigkeit Index mit Thesaurus z.B. Xindex mit UMLS-Metathesaurus Es werden nur relevante Begriffe in den Index aufgenommen Was Relevant ist wird an Hand von UMLS bestimmt Berechnung der Häufigkeiten von Worten und Wortgruppen Berechnung der Dichte dieser Worte und Wortgruppen

35 Funktion von Xindex mit UMLS-Metathesaurus
Dokument Primäre Wortliste (Konzepte) Wortliste Ranking Rank = Wörter pro Begriff * Anzahl * 1/Doclen * 1/Anz. Häufigster Begriff Index für das Dokument mit Preffered Terms

36 Vorteile von Xindex gegenüber dem Standard
Erkennen von Wortkombinationen z.B. Breast Cancer Gleiches Suchergebnis bei unterschielicher Schreibweise z.B. hpv und HPV z.B. MTX und Methotrexat Sinnvolles Suchergebnis bei trivialen Begriffen z.B. love --> HPV, Cervixcarzinom, Brustkrebs Es werden Dokumente in verschiedenen Sprachen gefunden z.B. Englisch, Deutsch und Spanisch

37 Vorteile von Xindex gegenüber WAIS
Beispiel Melanom

38 Vorteile von Xindex Es werden seltene Entitäten gefunden:
Suche nach „Melanom“ liefert Informationen zum „Wilms Tumor“ Dieser steht in Verbindung zum „clearcellsarcoma“ einer seltenen Form des Melanoms Erkennen von Synonymen z.B. Mumps, Parotitis epidemica

39 Der UMLS-Metathesaurus
Integration vorhandener Thesaurie: ICD 10, MESH, Cancerlit, HL7-Zusatz Mehrsprachig: z.B. Englisch, Deutsch, Spanisch, Russisch, Französisch, Finnisch, Italienisch, ... Konzeptorientierung: Jedes Konzept bekommt eine Nummer (CUI) Jedes Synonym jedes Konzeptes bekommt eine eigene Nummer in verschiedenen Sprachen sowohl normalisiert (SUI) als auch nicht normalisiert (LUI) Kennzeichnung des „Preffered Terms“

40 Nutzerprobleme Wie finde ich als Laie eine Information?
Wie kann ich die Seriosität einer Information erkennen (weit mehr fragliche Informationen denn gute) ? Wie finde ich beim Anbieter eine Information trotz bildorientierter Oberfläche?

41 Was man wissen sollte! Suchmaschinen lesen über „Spider“ Dokumente ein und erstellen einen Volltext-Index (nicht bei Datenbanken, Graphiken, Java). Metatags werden nur bedingt ausgewertet. (Anbieter manipulieren „auf Teufel komm raus“) Ranking ist nicht intelligent und bevorzugt kurze Dokumente. Für Geld wird das Ranking manipuliert!

42 Universität Bonn Vermittlung zu CancerNet Host=Lycos
a2z Katalog wurde am 28. März aus dem Angebot genommen Januar März Mai 1997

43 Meta-Tags <META NAME="keywords"
CONTENT="Breast cancer, oncology, Cancer, medicine, Medizin, Krebs, CancerNet, PDQ, Tumor"> <META HTTP-EQUIV="RESOURCE-TYPE" content="document"> <META name="description" content="Breast cancer">

44 Qualitätssiegel Geschütztes Logo einer anerkannten Organisation (NCI)
HON Code of Conduct Link von einer anerkannten Organisation (WHO) MedCERTAIN

45 Evaluation kommerzieller Anbieter
Kriterien für Focus Recherche Nutzen für den User Kostensenkung durch weniger Arztbesuche Richtigkeit und Ausgewogenheit Vollständigkeit Online-Arzt vorhanden

46 Ergebnis der Recherche für Focus
Der User kann einen Arzt finden. Ein Hausarzt-Buch ist auf mehrere Tausend Pages aufgeteilt. Der User verbringt viel Zeit für wenig Information im Netz. Seiten werden aus Datenbank generiert. Viele Wege führen zur gleichen Seite. Bachblüten und Standardtherapie gleichwertig im Angebot. Nur Infos vom eigenen Server. Suche extrem schwierig (Stunden) da Information versteckt. Online-Arzt ist nicht hilfreich für eigene Fragen (Show).

47 Was will der Nutzer? Informationen zu Krankheiten
Informationen zu eigenen Werten Zugriff auf die eigene Patientenakte Informationen zu Arzt, Krankenhaus oder Versicherung Sprechstunden, Besuchszeiten, Parkplatz Benchmarking im Qualitätsbereich Link Versicherungsvergleich

48 Aufbau von Suchmaschinen
Spider / Crawler (robot.txt) Indexer Broker (Schnittstelle zum Benutzer)

49 Spider / Crawler Nur ein Teil des WWW-Bereichs wird von einem Crawler erfaßt. Häufig werden Links nicht weiterverfolgt bei: dynamisch gestalteten Webseiten, Frames, Java und Bildern.

50 robots.txt User-agent: * Disallow: /usage/ Disallow: /dimdi/
Disallow: /standard/ Disallow: /standards/HL7/ Disallow: /niedergel/ Disallow: /epileptologie/epi_info/physicians/

51 Benutzerschnittstelle
Basic Search: +,- Groß/klein Schreibung Wildcards: * Phrasen in Hochkommata Advanced Search: Boolsche Algebra: AND, OR, XOR, NOT, NEAR

52 Beispiel: AltaVista 2943 Dokumente gmds: GMDS: 1418 Dokumente
gmds konferenz: +gmds konferenz: +gmds +konferenz: „gmds konferenz“:

53 Ranking Schlüsselwortdichte (Benachteiligung ausführlicher Dokumente)
Meta-Tags (oft manipuliert) Link Popularity (science citation index) Verkauf von Ranking-Prioritäten statt Werbung Neuere Ansätze

54 Aktualität Anzahl der Dokumente überschreitet die Kapazität der Suchmaschinen Scannen der Dokumente in mehrmonatlichen Abständen Zulassen mehrerer „no connection„ für bereits indexierte Dokumente Keine Strafen für tote Links in Dokumenten

55 Verzeichnisse Qualität der Bewertung liegt allein bei dem Redaktionsteam Nur wenige Dokumente können erfaßt werden Großer finanzieller Anreiz zur Manipulation

56 Benutzerschnittstelle


Herunterladen ppt "Medizinische Statistik und Informationsverarbeitung"

Ähnliche Präsentationen


Google-Anzeigen