בבית החולים איכילוב, כמוביל בתחום, קיים מאגר מידע דיגיטלי מגוון מזה כעשור. המאגר כולל מידע עצום הנאסף במהלך מפגשי המטופל עם שרותי בית החולים השונים, באשפוז, מערך אמבולטורי, שרותי דימות, מעבדות וכיוצא בזה.
עד כה, תשתית מאגר הנתונים התבססה על שרת SQL מקומי. עם הקמת המרכז למדע הנתונים (TAAMI) מושקעים משאבים רבים על מנת להקים תשתיות מידע חדשניות התומכות בפעילותו.
מקורות המידע (Data Ocean)
המידע כולל מקורות מידע שונים דוגמת: רשומה רפואית ממוחשבת, אבחנות, ניתוחים, פרוצדורות אחרות, דימות, מעבדות, תרופות, מדדים חיוניים, מידע ניהולי, מידע תפעולי, מידע כלכלי ועוד...

תשתיות המידע
עד כה תשתיות המידע התבססו על קיום מאגר מידע מבוסס SQL. לאחרונה, במסגרת המרכז למדעי הנתונים, נרכשו תשתיות מידע חדשניות המאפשרות עיבוד נתוני עתק (Big Data) ופיתוח מוצרי בינה מלאכותית (AI)
סוגי תשתיות המידע
תשתית בסיסית - SQL DWH
- קיים מזה 10 שנים
- מנוהל כבסיס מידע תפעולי
- היווה מינוף ליכולת עיבוד וניתוח מידע קליני ואחר
- נבנה ומנוהל ע"י יחידת ה – BI (בינה עסקית) של ביה"ח
תשתיות חדשניות - MDClone, K2View Fabric, Sandbox
מאפייני התשתיות החדשות הינם:
תשתיות מידע חדשניות:
- מאגרי נתוני עתק (Big Data)
- מצויים שרתי ענן
- יחידת הבסיס לאיסוף המידע הינה המטופל הבודד
- הטכנולוגיה מאפשרת עיבוד מידע מורכב במהירות גבוהה
- תומכת ביצירת והפעלת מודלים מתוחכמים של בינה מלאכותית
- MDClone- Data mining for researchers
היא תשתית לניהול נתוני עתק (Big-Data). מבנה הנתונים שונה ממחסן נתונים רגיל של SQL בכך שהנתונים אינם מסודרים כבסיס נתונים רלציוני, אלא "פרוסים" על ציר הזמן.
היתרון בתשתית של MDCLONE הוא מתן אפשרות לחוקרים/מפתחים לגשת לנתונים בצורה נוחה וזמינה ובכך לעודד את מערך המחקר והפיתוח בבית החולים ובנתוניו.

MDCLONE מאפשרת לחוקרים. מפתחים ללא ידע ב-SQL להתחבר למחסן הנתונים של בית החולים לטובת שליפת נתונים.
מבנה מאגר המידע באמצעות יחידות בסיס מינימליות מספק לחוקר יכולת אפיון מדויק של אוכלוסיית המחקר והפקת מסד נתוני עתק בזמן מינימלי. באופן זה תהליך ביצוע המחקר מתקצר משמעותית.
התשתית מציגה נתונים אנונימיים ויכולה להציג גם נתונים סינתטיים. נתונים סינתטיים הם כאלו שאינם תואמים לנתוני המקור כלל ולכן לא מאפשרים זיהוי של החולים בשום צורה, אך מבחינה סטטיסטית יתנו תוצאות זהות לחלוטין לנתוני המקור.
היא פלטפורמה מודרנית לניהול ואינטגרציה של מידע מבוזר ממקורות שונים. המערכת מספקת מידע בזמן אמת לכל משתמש קצה או אפליקציה.
יתרונות תשתית הנתונים המאוחדת מתבטאים בקיצור זמני תחקור וטיוב הנתונים, ביצוע תחקורים באמצעות כלי תחקור חיצוניים ברמת ישות בודדת וגם ברמה אגרגטיבית, יכולת ליצירת מערכות מומחה, הפעלת אלגוריתמים חכמים לזיהוי, תעדוף וחיזוי והכל מתבצע בזמן אמת.
הפלטפורמה מציגה גישה שונה לאיגוד, אחסון ושליפת המידע המצוי במערכות המידע השונות. מחסן נתונים מסודר ברמת "ישות לוגית" (Logical Unit) ומסונכרן בזמן אמת עם מערכות הליבה.
הישות הלוגית מייצגת יחידות ליבה של הארגון (דוגמת "מאושפז"). ה- Fabric מיצר מאגר נתונים מבוזר המאגד ומציג את כלל המידע על הישות הלוגית שהוגדרה.

ארגז החול הינו סביבת פיתוח אשר תוכננה בייחוד לצורכי פתרון בעיות עסקיות הרלוונטיות לתחום הפיתוח, במרכז הרפואי יהיו אלה בעיות קליניות ותפעוליות, באמצעות ניתוח מידע.
בדומה לארגז חול אמיתי, בו ילדים חולמים, משחקים ובונים כאוות נפשם מבלי להפריע לסביבתם, כך גם ארגז החול הוירטואלי מהווה סביבת פיתוח לעוסקים במדע הנתונים ובאנליזת נתונים.
בסביבה זו קיימים מגוון "צעצועים" (כלים) על מנת לבצע כל חישוב / עיבוד / ניתוח נתונים העולה בדעת החוקרים. הסביבה ממוקמת ב"ענן פרטי" המאובטח באמצעות חומת האש הארגונית. באופן זה החוקר יכול להנות מיתרונות השימוש בענן וללא פגיעה בחסיון המידע או בתשתית המידע הארגונית. ב – Sandbox ימצאו הכלים לביצוע פרויקטים, מחקרים ופיתוח ממוצרים מבוססי נתונים (Data-Driven Products). ניתן לראות דוגמאות ב"חדרי מחקר ופרויקטים"