פול טוראן

הדברים שלהלן לקוחים מתוך הרצאה שנתנה ע”י Gábor Halasz במסגרת תחרות המתמטיקה הדו-לאומית ישראל-הונגריה ע”ש פרופ’ יוסף גיליס ופרופ’ פול טוראן. את המאמר תירגם מר אורי וייס. ערך אותו בעברית: פרופ’ רון הולצמן. הכותב מניח ידיעה של מספרים מרוכבים.

פול טוראן (Paul Turán)

פול טוראן (Paul Turán) שעל שמו נקראת התחרות, היה הפרופסור שלי באוניברסיטה וראש המחלקה במכון המתמטי שבו עבדתי לאחר סיום לימודי.

אני יודע שבוודאי שמעתם עליו: נאמר לי שכולם מכירים את המשפט המפורסם שלו בתורת הגרפים (Graph Theorem). למעשה, הוא לא עבד הרבה בתורת הגרפים. פעמים רבות הוא הסתפק בלתת את התוצאה הראשונה, או להוכיח את המשפט הראשון, אשר יסדו תחום מחקר חדש ואז לתת לאחרים להרחיב את המשפטים והרעיונות שלו. בדרך זו הוא השאיר את חותמו בתחומים רבים של המתמטיקה כגון תורת המספרים, אנליזה, קומבינטוריקה, הסתברות, ואלגברה.

יוצא מן הכלל הוא מה שהיום נקרא “שיטת סכומי החזקות של טוראן”. זו היא יצירתו הגדולה ביותר ואשר עליה עבד לאורך כל חייו. הוא איגד את כל התוצאות שהשיג בתחום זה בספר שניקרא “על שיטה חדשה באנליזה  ושימושיה” (On a New Method of Analysis and its Applications) אשר פורסם לאחר מותו. בחלקו הראשון של הספר ניתנת התיאוריה עצמה אשר כוללת אי-שיוויונות כלליים עבור סכומים של חזקות של מספרים מרוכבים. אני מניח שאתם כבר מסוגלים לעכל את מרביתו של החלק הראשון. אתן דוגמה לסוג האי-שיוויונות שבהן עוסק הספר.

נניח שניתנים לנו מספר סופי של מספרים מרוכבים,

\(\displaystyle z_1, z_2, \ldots, z_n \)

העלו אותם בחזקת \({\nu}\) וסכמו אותם. התוצאה שתקבלו נקראת “סכום חזקות מיוחד”. אם נרשה בנוסף מקדמים מרוכבים כל שהם, הסכום יקרא “סכום חזקות כללי”:

\(\displaystyle s_\nu \overset{\text{def}}{=} b_1z_1^\nu + \cdots + b_n z_n^\nu \quad (\nu=m+1,\ldots,m+n) \)

אשר אותו נבחן עבור \({n}\) ערכים עוקבים של \({\nu}\), כאשר \({m\geq0}\) הוא מספר שלם נתון. טוראן התעניין בלהראות שסכומי החזקות הללו אינם יכולים להיות “קטנים מידי”, במילים אחרות הוא התעניין באי-שיוויון מהסוג:

\(\displaystyle \max_{m+1 \leq \nu \leq m+n} |s_\nu| \geq \ldots \)

כאשר הצד הימני יתכן ויהיה תלוי במקדמים \({b_j}\), ב – \({m}\) וב – \({n}\),
אבל אינו תלוי בערכי \({z_1,z_2,\ldots,z_n}\) (אך אולי יתכנו אילוצים
כלליים על ערכים אלו). בדוגמא הנוכחית, בצד הימני יופיע הגורם
\({|s_0|=|\sum_{j=1}^n b_j|}\) אשר יהיה הגורם היחיד אשר יהיה תלוי
במקדמים ובנוסף, יהיה האילוץ הבא על המספרים המרוכבים:

\(\displaystyle |z_j| \geq 1 \quad (j=1,\ldots,n) \)

אנו מעוניינים באי-השיוויון הטוב ביותר מסוג זה או לפחות משהו קרוב
אליו.

האם מישהו יכול להסביר למה אנו דורשים טווח של \({n}\) חזקות או יותר?
כלומר, למה לא יתכן אי שיוויון כזה עבור סדרה של \({n-1}\) חזקות עוקבות?
(שהרי ע”י בחירה מתאימה של המקדמים \({b_j}\)–פה בתפקיד הנעלמים–אנו
יכולים לדאוג שכל \({n-1}\) סכומי החזקות יהיו אפס וכן \({s_0\neq 0}\)).

במקום לחפש ישירות את ה – \({s_\nu}\) הגדול ביותר, נשתמש בעיקרון אשר
ניקרא “עיקרון הדואליות” (duality principle). במקרה שלנו
העיקרון מבוסס על אי שיוויון פשוט

\(\displaystyle \left| \sum_{\nu=m+1}^{m+n} c_\nu s_\nu \right| \leq \max_{m+1 \leq \nu \leq m+n} |s_\nu| \sum_{\nu=m+1}^{m+n} |c_\nu| \)

אם, ע”י בחירה מתאימה של המספרים המרוכבים \({c_\nu}\), נוכל לגרום לצד
השמאלי להיות “גדול” ותוך כדי כך לדאוג שהצד הימני ישאר “קטן” יחסית,
אז נקבל חסם תחתון טוב למקסימום אותו אנו בוחנים.

נציב את ערכו של \({s_\nu}\) ע”פ ההגדרה שלו,

\(\displaystyle \sum_{\nu=m+1}^{m+n} c_\nu s_\nu = \sum_{\nu=m+1}^{m+n} c_\nu (b_1z_1^\nu + \cdots + b_n z_n^\nu) \)

בסכום הכפול (הצד הימני) נסדר מחדש את האיברים ונקבץ יחדיו את אותם
איברים אשר מכילים את אותו \({z_j}\):

\(\displaystyle =\sum_{j=1}^n b_j (c_{m+1} z_j^{m+1} + \cdots + c_{m+n} z_j^{m+n}) \)

אם נבחר את המקדמים \({c_\nu}\) כך שכל הסכומים בתוך הסוגריים יסתכמו
לאחד,

\(\displaystyle c_{m+1} z_j^{m+1} + \cdots + c_{m+n} z_j^{m+n} = 1 \quad (j=1,\ldots,n) \)

אז הסכום הכפול יסתכם ל – \({s_0}\).

השיוויון האחרון הוא משוואה פולינומיאלית ב – \({z_j}\): נקח

\(\displaystyle P_{m+n}(z) = 1 – c_{m+1} z^{m+1} – \cdots – c_{m+n} z^{m+n}; \)

פה ובהמשך, הציון התחתי של הפולינום ישמש לציון הדרגה (או חסם עליון
עליה). בסימון זה עלינו אם כך לפתור

\(\displaystyle P_{m+n}(z_j) = 0 \quad (j=1,\ldots,n) \)

אילוץ זה קל לספק: כל ה – \({z_j}\) הם שורשיו של פולינום מדרגה \({n}\)

\(\displaystyle \omega_n(z) \overset{\text{def}}{=} \left(1-\frac{z}{z_1}\right)\cdots\left(1-\frac{z}{z_n}\right) \)

וכל מכפלה

\(\displaystyle P_{m+n}(z) \overset{\text{def}}{=} \omega_n(z) Q_m(z) \)

היא בעלת אותה תכונה; הפולינום \({Q_m}\) בעל דרגה לכל היותר \({m}\), כפי
שניתן ללמוד מהציון התחתי שלו, ע”מ לדאוג שדרגתו של \({P_{m+n}(z)}\) לא
תחרוג מ – \({m+n}\).

נניח כעת,

\(\displaystyle \omega_n(z) = a_0 + \cdots + a_n z^n \; (a_0=1), \quad Q_m(z) = d_0 + \cdots + d_m z^m \)

נשאר לנו לבחור את המקדמים \({d_0,\ldots, d_m}\). על הפולינום
\({P_{m+n}}\) להיות בעל צורה מיוחדת. המקדם החופשי
שלו הוא \({1}\):

\(\displaystyle a_0d_0=1 \quad \rightarrow \quad d_0=1 \)

וכן המקדמים עד לדרגה ה – \({m}\) מתאפסים:

\(\displaystyle \begin{array}{c} a_0 d_1 + a_1 d_0 = 0 \quad \rightarrow \quad d_1=\ldots \\ a_0 d_2 + a_1 d_1 + a_2 d_0 = 0 \quad \rightarrow \quad d_2=\ldots \end{array} \)

וכך הלאה. בצורה רקוסיבית ניתן לחשב את \({d_1,d_2,\ldots,d_m}\), שכן
\({a_0=1\neq0}\), על פי הידוע נכון לעכשיו (משפט חביב על
טוראן לציון עיניינים טריוויאליים).

על כן, חישבנו את \({c_\nu}\), אבל אנחנו עדיין לא סיימנו שכן הם תלויים
בערכים של המספרים \({z_j}\) ולכן עלינו למצא חסם עליון לסכום הערכים
המוחלטים שיהיה בלתי תלוי ב – \({z_j}\). הערכה זו היא פחות או יותר
מיידית ואני מתנצל שאינני נותן את כל הפרטים. אני משוכנע שתוכלו למלא
את הטיעונים החסרים.

למשל, תוכלו לראות בקלות שעבור \({P_{m+n}(z)}\) כמכפלת שני פולינומים
מתקבל

\(\displaystyle 1+\sum_{\nu=m+1}^{m+n} |c_\nu| \leq (|a_0|+\cdots+|a_n|) (|d_0|+\cdots+|d_m|) \)

עבור שני פולינומים מדרגה כלשהי, ואפילו עבור פולינומים מדרגה “אין
סופית”, כלומר מה שנקרא טור חזקות,

\(\displaystyle A(z) = \sum_{k=0}^\infty \alpha_k z^k, \quad B(z) = \sum_{k=0}^\infty \beta_k z^k \)

נשתמש בסימון

\(\displaystyle A(z) \ll B(z) \)

אותו נקרא כ – “\({B(z)}\) שולט על \({A(z)}\)” ומשמעו

\(\displaystyle |\alpha_k|\leq \beta_k \quad (k=0,1,\ldots) \)

בהמשך נעשה שימוש בחשבון של טורי חזקות פורמאליים (ללא צורך
בהתכנסות). אם המושג אינו מוכר לכם, תמיד תוכלו “לחתוך” את הטור
במקום סופי על מנת להצדיק את החישוב. בדרך זו, לדוגמא, קל לראות ש

\(\displaystyle A_1(z) \ll B_1(z),\; A_2(z) \ll B_2(z) \implies A_1(z)A_2(z) \ll B_1(z)B_2(z) \)

ובאינדוקציה ניתן להרחיב זאת למספר גורמים כלשהו במקום רק שניים.

נתחיל בכך שנמצא גורם השולט על \({\omega(z)}\). מכיוון ש \({|z_j|\geq1}\),

\(\displaystyle 1-\frac{z}{z_j} \ll 1+z \)

ועל פי ההערה האחרונה

\(\displaystyle \omega_n(z) \ll (1+z)^n, \quad |a_k|\leq \binom{n}{k}, \quad |a_0|+\cdots+|a_n|\leq 2^n \)

ובקשר ל – \({Q_m(z)}\), הגדרנו את המקדמים שלו בצורה רקורסיבית כאשר
עצרנו בשלב ה – \({m}\)-י. אם, במקום זאת, נמשיך ברקורסיה עד אינסוף (ad
infinitum), נקבל טור חזקות

\(\displaystyle Q(z) = \sum_{k=0}^\infty d_k z^k \)

עבורו

\(\displaystyle \omega_n(z) Q(z) = 1 \)

כלומר

\(\displaystyle \begin{array}{ll} Q(z) &= \displaystyle{\frac{1}{\omega_n(z)} = \frac{1}{\left(1-\frac{z}{z_1}\right)\cdots\left(1-\frac{z}{z_n}\right)} =} \\ &\displaystyle{\left(1 + \frac{z}{z_1} + \left(\frac{z}{z_1}\right)^2 + \cdots \right)\cdots \left(1 + \frac{z}{z_n} + \left(\frac{z}{z_n}\right)^2 + \cdots \right) \ll} \\ & \quad \quad \quad \quad \displaystyle{(1+z+z^2+\cdots)^n = \frac{1}{(1-z)^n} = \sum_{k=0}^\infty \binom{n+k-1}{k} z^k} \end{array} \)

ע”פ משפט מקדמי הבינום הכללי (General Binomial Theorem). זה
גורר בפרט ש

\(\displaystyle |d_k|\leq\binom{n+k-1}{k},\quad |d_0|+\cdots+|d_m| \leq \sum_{k=0}^m \binom{n+k-1}{k}=\binom{n+m}{m} \)

לסיכום, הוכחנו את אי השיוויון לסכומי חזקות הבא

\(\displaystyle \max_{m+1 \leq \nu \leq m+n} |s_\nu| \geq \frac{|s_0|}{2^n \sum_{k=0}^m \binom{n+k-1}{k} – 1}=\frac{|s_0|}{2^n \binom{n+m}{m} – 1} \)

עם מעט יותר דקדקנות בפרטים היינו יכולים להשיג את החסם האופטימלי
(שהוא מעט יותר טוב).

אני רוצה להציג לכם בעיה מחוץ לתחרות. אני חושש שאתם כבר שבעים
מבעיות מתמטיות, אך לזו אין זמן הגשה.

נתתי את הבעיה הזו בתחרות שוויצר (Schweitzer) ב – \({1976}\), השנה
שבה טוראן הלך לעולמו, והיא הוקדשה לזיכרו. טוראן היה אחד מהמארגנים
של התחרות ושוויצר היה סטודנט שלו, אשר נהרג על ידי הנאצים במלחמת
העולם השניה כאשר היה בתחילתה של קריירה מבטיחה. התחרות היא עבור
תלמידי אוניברסיטה בהונגריה, אך אני בטוח שתוכלו לפתור את הבעיה גם
כן; עקבו אחר דרך הפתרון של ההוכחה למעלה.

בעיה: הוכיחו את האי-שיוויון

\(\displaystyle \max_{1 \leq |\nu| \leq n} |s_\nu| \geq \frac{|s_0|}{n} \)

ללא שום תנאים על \({z_j}\) ו – \({b_j}\) מלבד הדרישה

\(\displaystyle z_j \neq 0 \quad (j=1,\ldots,n) \)

זה נידרש כי אנו מרשים גם חזקות שליליות.

נמשיך. תחום ההתעניינות העיקרי של טוראן היה תורת המספרים האנליטית.

לעיתים רבות במתמטיקה, במקום לתקוף את הבעיה שלך ישירות, ניתן להשיג
פתרון ע”י דרך עקיפה. (דוגמא לכך ראינו כאשר השתמשנו בדואליות בהוכחה
שנתנו קודם). דוגמה טובה לרעיון זה היא השיטה בה נחקרים המספרים
הראשוניים בתורת המספרים האנליטית ע”י שימוש בפונקציה יוצרת.

הפונקציה המתאימה היא פונקצית זטה של רימן (Riemann’s zeta
function)

\(\displaystyle \zeta(s) \overset{\text{def}}{=} \sum_{n=1}^\infty \frac{1}{n^s} \)

היא מתקשרת למספרים ראשוניים ע”י הצגת אוילר כמכפלה אינסופית
(Euler’s product representation)

\(\displaystyle \zeta(s) = \frac{1}{1-\frac{1}{2^s}}\frac{1}{1-\frac{1}{3^s}} \cdots = \prod_{p} \frac{1}{1-\frac{1}{p^s}} \)

כאשר במכפלה האינסופית המספרים במכנה רצים על כל המספרים הראשוניים.
קל לבדוק את הזהות הזו בצורה פורמלית: כל גורם הוא טור גיאומטרי

\(\displaystyle \frac{1}{1-\frac{1}{p^s}} = 1 + \frac{1}{p^s} + \frac{1}{p^{2s}} + \cdots \)

וכאשר פותחים סוגריים במכפלה האינסופית מתקבלים גורמים כגון

\(\displaystyle \frac{1}{p_1^{k_1s} \cdots p_r^{k_rs}} = \frac{1}{n^s} \)

כאשר

\(\displaystyle n = p_1^{k_1} \cdots p_r^{k_r} \)

כל מספר שלם מופיע בדיוק פעם אחת בצורה זו וכך אנו מקבלים את הצורה
המקורית של פונקצית זטה. הצגת אוילר היא על כן ניסוח אנליטי של המשפט
היסודי של תורת המספרים (Fundamental Theorem of Number Theory).

הרעיון הוא שניתן לחשב או לבחון את \({\zeta(s)}\) בהסתמך על הגדרתה ללא
איזכור של הראשוניים ואז להשתמש במידע שהתקבל עבור הראשוניים. למטרה
זו עלינו להיות מסוגלים לחשב גם במספרים מרוכבים: על פי תגליתו פורצת
הדרך של רימן באמצע המאה ה – \({19}\), מה שהוביל ללידתה של תורת המספרים
האנליטית, ההתנהגות של פונקצית זטה במישור המרוכב, במיוחד במקומות
שבהם היא מתאפסת, קשורה בקשר עמוק להתפלגותם של המספרים הראשוניים.
הוא שיער השערה לגבי המקומות שבהם פונקצית זטה מתאפסת, אשר נקראת
השערת רימן (Riemann’s Hypothesis), ואשר שקולה לכך שהראשוניים
מתנהגים בצורה רגולארית. (זו היא רק אחת מהיוזמות של רימן; ניתן למצא
את שמו כמעט בכל תחום של המתמטיקה. לאור מה שאמרתי לגבי איך שטוראן
ראה את תפקידו הוא במתמטיקה, זה אינו פלא שהוא החשיב את רימן כגדול
המתמטיקאים בעת המודרנית.)

ההצלחה הראשונה של הגישה של רימן היתה ההוכחה של משפט המספרים
הראשוניים (Prime Number Theorem) ע”י הדמרד (Hadamard) ודה
לה וואלה-פוסן (de la Vallée-Poussin). אם נסמן, כפי שנהוג,
את מספר הראשוניים שהם קטנים או שווים ל – \({N}\) ע”י \({\pi(N)}\),

\(\displaystyle \pi(N) \approx \frac{N}{\log N} \quad (N \rightarrow \infty) \)

ישנם \({N}\) מספרים שלמים עד ל – \({N}\) ואנו רואים שהראשוניים הם פחות מכך
בגורם \({\log N}\); זהו הלוגריתם הטבעי של \({N}\) (natural
logarithm). השערת רימן מתקשרת לכמה טובה הערכה זו–או על מנת להיות
מדוייקים יותר, היא קשורה לקירוב טוב יותר ע”י פונקציה אחרת במקום
\({N/\log N}\)–והיא עדיין פתוחה בימינו אנו. זו הבעיה הבולטת ביותר
בתורת המספרים, אם לא בכל המתמטיקה.

לא אוכל להסביר את הקשר בין \({\zeta(s)}\) והמספרים הראשוניים ביתר
פירוט. נסתפק בכך שנאמר כי לפונקציות מרוכבות יש גם נגזרות
ואינטגרלים, השונים בעיקרם מהמקרה הממשי, ותוכלו להבין את הקשר כאשר
תלמדו יותר על נושא זה.

כעת, טוראן רצה להוכיח לא פחות מאשר את השערת רימן. היה לו
רעיון מקורי על איך לתקוף אותה ורעיון זה הוביל אותו לעבר אי-
שיוויונות של סכומי חזקות. לכן, הם היו עבורו לא רק מטרה לשם עצמה.
הוא אף פעם לא התעניין בבעיות כבעיות. במתמטיקה שלו הוא תמיד דורבן
על ידי ישומים ועל ידי חשיבות הבעיה.

למרות שלא הצליח להשלים את מטרתו הסופית, על ידי אי-שיוויונות של
סכומי חזקות מורכבים יותר מזה שהוכחנו פה, הוא הצליח, למרות הכל, להשיג
תוצאות חדשות על ההתפלגות של מספרים ראשוניים והוא מצא מאוחר יותר
שאפילו אי שיוויונות פשוטים (כגון זה שראינו; מה שנקרא על ידו משפטו
הראשון) הם בעלי שימושים מעניינים בתחומים שונים של אנליזה ותורת
המספרים. זהו התוכן של חלקו השני של ספרו.

בהקשר זה אני נזכר במתמטקאי הונגרי בולט אחר בשם פול ארדש
(Paul Erdös). טוראן וארדש היו חברים טובים אך ארדש היה כמעט
ההפך מטוראן. הוא היה פותר בעיות ובאותה נשימה היה מתמטיקאי שהציג
בעיות מתמטיות חדשות והתעניין בבעיה המתמטית עצמה. טוראן פעמים רבות
הסתייג מכך שארדש נהג להתפזר על בעיות רבות כל כך ולא התמקד בבעיות
החשובות.

(טוראן לא לגמרי צדק, והוא ידע זאת. ארדש היה בעל יכולת יוצאת מן
הכלל לשים את האצבע, אולי באופן לא מודע, על הבעיה הנכונה ואכן בעיות
רבות הפכו להיות תחילתו של מחקר חדש וחשוב.)

לפעמים, טוראן גם עשה “שימושים” לא שיגרתיים במתמטיקה. במשך המלחמה
הוא היה עצור במחנה עבודה נאצי. בזמן שהוא תקע יתדות וסחב לבנים הוא
חשב על בעיות שיכול לפתור ללא ניר ועיפרון. זו היתה הדרך שבה הוא גילה
את משפטו המפורסם בתורת הגרפים. זו מתנה בעלת ערך רב להיות מסוגל
לעשות מתמטיקה כאשר חייך בסכנה ואינך יודע אם תחיה גם מחר. זה עזר לו
להחזיק מעמד במשך כמעט שלוש שנים של מאסר. הוא שמר על אהבתו לעשית
מתמטיקה עד ליום מותו והוא לא היה מסוגל להעביר יום מבלי לחשוב על
מתמטיקה, ללא קשר לכמה קשה היה היום ואפילו כשכבר היה מאוד חולה.

סיפור אמיתי נוסף הוא שמייד אחרי המלחמה הוא נעצר על ידי חיילים
רוסיים שביקשו את הניירות שלו. במקום זאת, הוא הראה להם מאמר שלו
שהתפרסם בירחון הרוסי איזבסטיה (Izvestiya) עם שמו שרשום שם
ברוסית. הם נתנו לו ללכת. הוא היה יכול באותה מידה לגמור בגולג אשר
בסיביר; אי אפשר היה לדעת בימים ההם.

לא היו לו חיים קלים גם אחרי המלחמה. הוא קיבל הרבה כבוד על עבודותיו
בצורת פרסים נחשבים, אך זה לא מנע מאנשים לצאת בביקורת פוליטית נגדו
במסווה של קידום מתמטיקה שימושית ודברים דומים וכך שהרבה מזמנו היקר
הוקדש להגנה על עצמו ועל המדע האמיתי שהוא ייצג.

הוא לא היה יכול לחזות זאת, אך לאמיתו של דבר זו היתה בחירתו האישית.
בשנת \({1948}\) הוא ביקר במכון ללימודים מתקדמים בפרינסטון ארה”ב
(Institute for Advanced Study at Princeton). זה המכון שבו
אינשטיין עבד לאחר שעזב את גרמניה ובו היו (ועדיין ישנם) רק הגדולים
ביותר בעלי משרה קבועה. לטוראן הוצעה משרה קבועה במכון. הוא היה יכול
לעבוד בתנאים הטובים ביותר שמתמטיקאי יכול לחלום עליהם. אבל, הוא
העדיף לקבל משרה באוניברסיטת בודפשט, שכן הוא ראה את עצמו כמתמטיקאי
הונגרי וחשב שזו היתה חובתו לחזור הביתה וליסד סביבו קבוצת תלמידים.

לסיכום, אני אומר שלא רק שהוא היה מתמטיקאי דגול, הוא גם היווה דוגמא
עבורנו למדען ובן אדם.