חיבור אופטי במהירות גבוהה: פתרונות מרכז נתונים

Apr 27, 2026|

ברבעון האחרון היה לנו לקוח ששלח בחזרה ארבעים מודולי DR4 בנפח 400G שטענו לדשי קישור אקראיים על מתגי Arista 7060X5 שלהם. לפני שבכלל פתחנו את הניירת של RMA, מהנדס הבדיקה שלנו שאל שאלה אחת: האם בדקת אתמחברי MPOלפני ההתקנה? הם לא עשו זאת. שלחנו את המודולים דרך הרגרסיה המלאה שלנו, דיאגרמות עיניים נקיות, BER מתחת ל-1E-13 על פני כל ארבעת הנתיבים,קריאות DDM נומינליות. אחר כך ביקשנו מהם לשלוח תמונות של קצה כבל המטען שלהם-תחת מיקרוסקופ סיבים. לכל מחבר בודד היה זיהום חלקיקים. ארבעים מודולים, אפס פגמים. הבעיה הייתה אבק.

 

אנחנו רואים גרסה כלשהי של זה כל חודש. פריסות חיבור אופטי במהירות גבוהה בכל קנה מידה פוגעות באותו קיר, והמספרים מגבים זאת: איפשהו בין 65% ל-70% מכל כשלי הקישור של 400G ו-800G נעוצים בחזרה לזיהום מחברים, לא לתקלות במקלטי משדר. (נתוני שדה IEEE 802.3 באמצעות AscentOptics) אנו מעלים זאת תחילה כי זה מסגר את האופן שבו אנו חושבים על כל החלטת החיבורים. המודול הוא כמעט אף פעם לא החוליה החלשה ביותר. הרובד הפיזי שסביבו הוא.

Microscopic view of an MPO fiber optic connector end-face showing severe dust and particulate contamination on the four precision glass cores of a 400G module, illustrating the number one cause of link failure.

 

דפוס התנועה שלך קובע את ארכיטקטורת החיבורים האופטיים שלך

 

כולם מתחילים עם מספר החלק.QSFP-DD או OSFP, SR או DR, מצב ריבוי או- יחיד. גם אנחנו עושים את זה. אבל הפריסות שהלכו טוב עבור הלקוחות שלנו התחילו כולן במקום אחר: איך בעצם נראית התעבורה?

אימון בינה מלאכותית-בקנה מידה גדול מייצר כל-כל-תקשורת GPU שמתגלה כצפוי באופן מפתיע לאורך טווחי זמן של דקות עד שעות. גוגל מנצלת זאת באמצעות מתגי מעגלים אופטיים ברשת יופיטר שלהם, ומגדירה מחדש נתיבי אור פיזיים בין מתלים במקום להחליף מנות. התוצאות שפורסמו מעשור של שימוש בייצור: הפחתת צריכת חשמל של 41%, עלות נמוכה יותר ב-30% ושיפור של פי 50 בזמן פעילות הבד לעומת ארכיטקטורת Clos הקודמת שלהם. (גוגל SIGCOMM'22) המספרים האלה אמיתיים, אבל הם שייכים לחברה שהוציאה בין 500 מיליון דולר למיליארד דולר על תשתית OCS במשך חמש שנים. היו לנו קומץ לקוחות בגודל בינוני- שביקשו מאיתנו להעריך את היתכנות OCS עבור הסביבות שלהם. בכל מקרה, ברגע שהם הריצו את המספרים בסולם תת--500 צמתים, דרישות ההון עלו על יתרונות התצורה מחדש, והם נשארו עם עמוד שדרה קונבנציונלי באמצעות מודולים ניתנים לחיבור.

הסקת מסקנות הופכת את המשוואה. התנועה מפוצצת ובלתי ניתנת לחיזוי ברמת הזרימה, וסובלנות ההשהיה קרובה לאפס. אינך יכול להגדיר מחדש נתיבים אופטיים על בסיס-בקשה. מה שאתה צריך זה מארג עם אספקת יתר באופן עקבי עם חביון דטרמיניסטי, שדוחף אותך לעבר מקלטי משדר ניתנים לחיבור בטופולוגיית עמוד השדרה-שבו כל קישור מואר תמיד. אנו מוכרים מודולים בשני התרחישים, והשיחות ההנדסיות שונות לחלוטין. רוכשי אשכול הדרכה רוצים לדעת על רוחב פס מצטבר לכל מתלה והספק לכל סיביות. קוני מסקנות שואלים על זמן השהיית זנב ומה קורה כאשר קישור יורד.

 

Conceptual architectural diagram of a data center network topology comparing a custom Optical Circuit Switch (OCS) fabric for long-running AI training jobs versus a standard non-blocking Spine-Leaf topology for bursty inference workloads.

 

עבור סביבות ארגוניות מסורתיות וקולו מתחת לקנה מידה גבוה, העלות ליציאה שולטת ותאימות לאחור למפעלי סיבים קיימים חשובה יותר מצפיפות רוחב הפס הגולמי. בדקנו את שלנו400G QSFP-מודולי DD על פני 14 פלטפורמות מתגכולל Cisco Nexus 93600CD, Arista 7060X5 ו-Juniper QFX5220. בסביבות אלו, החשש הדומיננטי אינו מהירות. זה האם המודול יזוהה על ידי קושחת המתג ללא פקודות עקיפה ידניות.

 

אזור המלח 800G שתופס את המהנדסים

 

ב-400G, בחירת חיבור היה תהליך דו-שלבי: למדוד את המרחק, לבחור נחושת או סיבים. DAC פסיבי כיסה 3 עד 5 מטרים בנוחות. 800G שבר את זה. כל נתיב מפעיל 112G PAM4. אובדן הנחושת בתדרים האלה מוכפל בערך לעומת 400G, והתוצאה היא תקרה קשה בסביבות 2 מטרים עבור כבל פסיבי.

 

High-speed cable comparison showing an Active Electrical Cable (AEC) vs a standard Direct Attach Copper (DAC) bundle. The AEC uses internal retimers to extend the 800G signal reach to 7 meters at the cost of slight latency overhead.

 

למדנו את זה בדרך היקרה. לקוח מוקדם הזמין שלנומכלולי DAC פסיביים של 800Gבאורך של 3 מטר על סמך פריסת מתלה 400G שלהם. אימון קישור נכשל בלמעלה מ-60% מהיציאות. הנחושת לא הייתה פגומה; הפיזיקה פשוט לא אפשרה את זה. הם עברו ל-AEC לריצות של 3 עד 5 מטר ולמודולים אופטיים ניתנים לחיבור לכל מה שמעבר, והפריסה התייצבה תוך שבוע. מאז, הפסקנו לקבל הזמנות עבור 800G DAC פסיבי מעל 2.5 מטרים והוספנו ייעוץ למרחק פריסה לתהליך אישור ההזמנה שלנו.

 

AEC מחזיקה כעת בפער של 3 עד 7 מטר. טיימרים דיגיטליים מחדשים את האות באופן חשמלי ללא המרה אופטית, מה שמפחית את העלות אך מוסיף חביון. KP4 FEC לבדו שם 50 עד 100 ננו-שניות על כל קפיצה ב-800G, וה-Retimer מערם יותר למעלה. מדדנו זמן אחזור כולל של 85 עד 110 ns במכלולי AEC שאנו שולחים כעת. עבור קישורי בד{10}}שדרה, התקורה הזו בלתי נראית בביצועי האפליקציה. לגבי אשכולות GPU מחוברים הדוק זה סיפור אחר. בהתבסס על נתוני פרופילים משלוש פריסות של לקוחות המרצות צמתים H100, אם תקורה התקשורתית של עבודת ההדרכה שלך כבר עומדת על מעל 15%, מאה ננו-שניות נוספות לכל קפיצה על פני שכבות מתג מרובות מתחילות להתערב בפעולות NCCL AllReduce.

 

מעבר ל-7 מטרים, מקלטי משדר אופטיים ניתנים לחיבור עבור 800G הם הנתיב הקיים היחיד. הדרישות של הרובד הפיזי מתהדקות כאן במידה ניכרת. סוף-ל-תקציבי אובדן הכנסה תחת IEEE 802.3ck נוחתים מתחת ל-1.5 dB עבור רוב מחלקות הטווח של 800G, וכל חיבור MPO משודך חייב להישאר מתחת ל-0.35 dB. ראינו סיבים מותקנים שעברו הסמכה ב-100G מציגים ערכי PMD פי שניים עד שלושה מעל המפרט המדורג שלו לאחר מספר שנים של דחיסה במגשי כבלים, בהתאם למה שדיווח צוות מחקר הרשת של Juniper בשנת 2023. ההמלצה הסטנדרטית שלנו לפני כל פריסת מקלט משדר 800G: הפעל אפיון OTDR ו-PMD על כל מקטע סיבים קיים. לא מדגם. כל קטע. העלות של-משיכה מחדש של שני כבלי מטען היא חלק מהעלות של איתור באגים של דשי קישור לסירוגין במשך שישה חודשים.

 

CPO לעומת LPO לעומת Pluggable: איפה כל טכנולוגיה עומדת למעשה בשנת 2026

 

אופטיקה משולבת-תשנה את אופן בניית תשתית החלפת מרכז הנתונים. אנחנו אומרים את זה כיצרן מודולים ניתנים לחיבור, אז קחו את השקפתנו כמושכלת ולא כנייטרלית.

 

ב- OFC 2026, נתוני אמינות על אבות טיפוס של CPO הראו שיעורי כשל שעלולים להיות נמוכים יותר ממודולים ניתנים לחיבור מסורתיים. ללא מחזורי החדרה מכניים או משטחי מחבר חשופים, מצבי הכשל הדומיננטיים של מודולים הניתנים לחיבור פשוט אינם חלים. פלטפורמת המתגים של Bailly 51.2T CPO של Broadcom הפגינה צריכת חשמל נמוכה ב-70% בערך בשכבה האופטית בהשוואה לתצורות מקבילות לחיבור. (דוח חיבור אופטי של DataMIntelligence) NVIDIA הראתה מתגים משולבים-ב-CPO בפריסה{2}}להגדלת המיקוד של GTC 2026 בחלון 2027 עד 2028.

 

העמדה שלנו: אם אינך סופר-scaler בונה סיליקון מתג מותאם אישית, אופטיקה ניתנת לחיבור היא האפשרות היחידה הניתנת לפריסה עד 2027 לפחות. CPO זקוק לארכיטקטורות של לוחות שרוב ספקי המתגים עדיין לא שלחו, תקני מחברים שאינם סופיים וספר הפעלה חדש לגמרי לטיפול בכשלים שלא ניתן לתקן על ידי משיכת מודול. המערכת האקולוגית לרכש ארגוני כללי לא קיימת עדיין. היו לנו שני לקוחות פוטנציאליים בשנה האחרונה שעיכבו את שדרוגי ה-400G-ל-800G שלהם בהמתנה ל-CPO. שניהם חזרו בסופו של דבר וביצעו הזמנות שניתנות לחיבור לאחר שפערי רוחב הפס שלהם הפכו לאירועי ייצור. כתבנו על הרציונל ההנדסי לתפקיד זה ביתר פירוט בכתובת שלנוניתוח ארכיטקטורת מקלטי משדר ניתנים לחיבור.

 

LPO יושב בחלל אחר. הסרת ה-DSP מהמודול מנתקת את הרכיב היחיד הצריך ביותר-הספק, האחראי על עד מחצית מצריכת החשמל הכוללת של המודול. התוצאה היא צריכה נמוכה ב-30 עד 50% ועד 15 ננו-שניות פחות זמן אחזור. התחלנו להגיש הצעות ל-LPO-ספציפיות בסוף 2025. שלושה מתוך הארבעה הגיעו מלקוחות שבנו אשכולות GPU יחידים של-ספקים ב-NVIDIA Spectrum-X. אף אחד לא פעל בדים מרובי{12}}ספקים, מה שאומר לך הכל על המקום שבו LPO עובד היום. אם הרשת שלך מערבבת ספקי מתגים, LPO אינו תואם לסביבה שלך. אם אתה מפעיל אשכול בינה מלאכותית של-ספק יחיד, זה עשוי להיות השדרוג החכם ביותר שקיים, ואנו מצפים שיהיו לנו מודולים מוכנים ל-LPO-באמצעות 2027.

המשמעות של שוליים תרמיים של 800G עבור בחירת מודול

 

המתמטיקה התרמית ב-800G תופסת אנשים לא מוכנים. צפיפות הספק של חיבור אופטי במהירות גבוהה בדור זה יוצרת בעיות שפשוט לא היו קיימות ב-400G. מתג בעל 64 יציאות עמוס במלואו עם מודולים של 800G ב-16W כל אחד שואב כ-1kW בהספק של מקלט-משדר בלבד, לפני שהמתג ASIC עצמו 400 עד 500W. זה 1.4 עד 1.5 קילוואט לכל מתג. שמונה מתגים בשכבת עמוד השדרה מעמידים אותך מעל 11 קילוואט מציוד רשת בלבד, במדפים שסופקו לרוב עבור 8 עד 10 קילוואט בסך הכל.

 

Juniper Networks מזהירה במפורש שמודולים של צד שלישי- עם צריכת חשמל גבוהה, במיוחד סוגי ZR ו-ZR+ קוהרנטיים, עלולים לגרום לנזק תרמי לציוד המארח, כשהאחריות תיפול על המשתמש. (שאלות נפוצות בנושא אופטיקה של Juniper Networks 800G) זה לא טיעון נגד-מודולים אופטיים של צד שלישי. זהו טיעון לדעת בדיוק מה אתה מחבר לחשמל. בהסמכת הרכיבה התרמית שלנו, אנו בודקים כל עיצוב מודול 800G בטמפרטורת צומת מתמשכת של 85 מעלות למשך 2,000 שעות ועוקבים אחר סחף זרם הטיית לייזר כמחוון ההזדקנות העיקרי. יחידות שנסחפות מעל 38 mA נשלפות מקו הייצור. בצפיפות של 800G, ההבדל בין מודול השואב 14W לשרטוט אחד של 18W קובע אם מתלה נשאר במעטפת תרמית או מפעיל אזעקות כיבוי בשעה 2 לפנות בוקר. לטעות במפרט תמיד היה מעצבן. ברמות ההספק האלה, זה יקר.

Thermal heatmap of a high-density switch rack illustrating extreme heat concentration in the transceiver cage area where 64 modules drawing 16W each generate significant thermal load, nearing cooling capacity limits.

 

 

אנו שולחים מודולים ניתנים לחיבור מ- 1G SFP עד 800G OSFP, ואנו בודקים מול פלטפורמות מתגים מרכזיות. אנחנו מנהלים תיעוד של מה עובד ומה לא. אם אתה זקוק לבדיקת תאימות מול סביבת מתגים ספציפית, או אם אתה רוצה מפרט תרמי והספק-עבור מתלים 800G בצפיפות גבוהה-, המהנדסים שלנו מנהלים את השיחות הללו מדי שבוע. שֶׁלָנוּ800G OSFP ו-QSFP-דף מקלט משדר DD800יש מפרטים, אפשרויות-מחלקות טווח וטפסי בקשה לדוגמה עבור כל מודול שאנו שולחים.

שלח החקירה