Giáo trình Lập trình hướng đối tượng - OOP bản thảo 2013 - UET PDF
Document Details
Uploaded by Deleted User
Đại học Kỹ thuật Công nghệ Thành phố Hồ Chí Minh
2013
Tags
Summary
This document is a course outline or reading materials for a lecture or training program on object-oriented programming (OOP). It covers the basics of OOP and uses Java’s programming language.
Full Transcript
Mục lục GIỚI THIỆU.............................................................................5 Chương 1. MỞ ĐẦU............................................................7 1.1. KHÁI NIỆM CƠ BẢN................................................12 1.2. ĐỐI TƯỢNG VÀ LỚP....................
Mục lục GIỚI THIỆU.............................................................................5 Chương 1. MỞ ĐẦU............................................................7 1.1. KHÁI NIỆM CƠ BẢN................................................12 1.2. ĐỐI TƯỢNG VÀ LỚP................................................13 1.3. CÁC NGUYÊN TẮC TRỤ CỘT................................15 Chương 2. NGÔN NGỮ LẬP TRÌNH JAVA...................20 2.1. ĐẶC TÍNH CỦA JAVA..............................................20 2.1.1. Máy ảo Java – Java Virtual Machine...............21 2.1.2. Các nền tảng Java.............................................23 2.1.3. Môi trường lập trình Java................................23 2.1.4. Cấu trúc mã nguồn Java..................................24 2.1.5. Chương trình Java đầu tiên.............................25 2.2. BIẾN.............................................................................27 2.3. CÁC PHÉP TOÁN CƠ BẢN......................................28 2.3.1. Phép gán............................................................28 2.3.2. Các phép toán số học........................................28 2.3.3. Các phép toán khác..........................................29 2.3.4. Độ ưu tiên của các phép toán..........................30 2.4. CÁC CẤU TRÚC ĐIỀU KHIỂN................................30 2.4.1. Các cấu trúc rẽ nhánh.......................................31 2.4.2. Các cấu trúc lặp................................................37 2.4.3. Biểu thức điều kiện trong các cấu trúc điều khiển 43 Chương 3. LỚP VÀ ĐỐI TƯỢNG....................................48 3.1. TẠO VÀ SỬ DỤNG ĐỐI TƯỢNG............................49 3.2. TƯƠNG TÁC GIỮA CÁC ĐỐI TƯỢNG.................51 Chương 4. BIẾN VÀ CÁC KIỂU DỮ LIỆU......................57 4.1. BIẾN VÀ CÁC KIỂU DỮ LIỆU CƠ BẢN.................58 4.2. THAM CHIẾU ĐỐI TƯỢNG VÀ ĐỐI TƯỢNG......59 4.3. PHÉP GÁN..................................................................62 4.4. CÁC PHÉP SO SÁNH................................................63 1 4.5. MẢNG.........................................................................64 Chương 5. HÀNH VI CỦA ĐỐI TƯỢNG.......................70 5.1. PHƯƠNG THỨC VÀ TRẠNG THÁI ĐỐI TƯỢNG70 5.2. TRUYỀN THAM SỐ VÀ GIÁ TRỊ TRẢ VỀ..............71 5.3. CƠ CHẾ TRUYỀN BẰNG GIÁ TRỊ..........................73 5.4. ĐÓNG GÓI VÀ CÁC PHƯƠNG THỨC TRUY NHẬP 75 5.5. KHAI BÁO VÀ KHỞI TẠO BIẾN THỰC THỂ........79 5.6. BIẾN THỰC THỂ VÀ BIẾN ĐỊA PHƯƠNG...........80 Chương 6. SỬ DỤNG THƯ VIỆN JAVA.........................85 6.1. ArrayList.....................................................................85 6.2. SỬ DỤNG JAVA API.................................................87 6.3. MỘT SỐ LỚP THÔNG DỤNG TRONG API...........88 6.3.1. Math...................................................................88 6.3.2. Các lớp bọc ngoài kiểu dữ liệu cơ bản............89 6.3.3. Các lớp biểu diễn xâu kí tự..............................90 6.4. TRÒ CHƠI BẮN TÀU................................................91 Chương 7. THỪA KẾ VÀ ĐA HÌNH............................. 103 7.1. QUAN HỆ THỪA KẾ.............................................. 103 7.2. THIẾT KẾ CÂY THỪA KẾ...................................... 104 7.3. CÀI ĐÈ – PHƯƠNG THỨC NÀO ĐƯỢC GỌI?... 107 7.4. CÁC QUAN HỆ IS-A VÀ HAS-A........................... 108 7.5. KHI NÀO NÊN DÙNG QUAN HỆ THỪA KẾ?.... 110 7.6. LỢI ÍCH CỦA QUAN HỆ THỪA KẾ..................... 110 7.7. ĐA HÌNH.................................................................. 111 7.8. GỌI PHIÊN BẢN PHƯƠNG THỨC CỦA LỚP CHA114 7.9. CÁC QUY TẮC CHO VIỆC CÀI ĐÈ....................... 115 7.10. CHỒNG PHƯƠNG THỨC.................................... 116 7.11. CÁC MỨC TRUY NHẬP....................................... 117 Chương 8. LỚP TRỪU TƯỢNG VÀ INTERFACE........ 124 8.1. MỘT SỐ LỚP KHÔNG NÊN TẠO THỰC THỂ.... 124 8.2. LỚP TRỪU TƯỢNG VÀ LỚP CỤ THỂ................. 126 2 8.3. PHƯƠNG THỨC TRỪU TƯỢNG.......................... 127 8.4. VÍ DỤ VỀ ĐA HÌNH................................................ 127 8.5. LỚP Object................................................................ 131 8.6. ĐỔI KIỂU – KHI ĐỐI TƯỢNG MẤT HÀNH VI CỦA MÌNH 132 8.7. ĐA THỪA KẾ VÀ VẤN ĐỀ HÌNH THOI.............. 135 8.8. INTERFACE.............................................................. 137 Chương 9. VÒNG ĐỜI CỦA ĐỐI TƯỢNG................... 143 9.1. BỘ NHỚ STACK VÀ BỘ NHỚ HEAP................... 143 9.2. KHỞI TẠO ĐỐI TƯỢNG........................................ 145 9.3. HÀM KHỞI TẠO VÀ VẤN ĐỀ THỪA KẾ............ 149 9.3.1. Gọi hàm khởi tạo của lớp cha........................ 150 9.3.2. Truyền đối số cho hàm khởi tạo lớp cha...... 152 9.4. HÀM KHỞI TẠO CHỒNG NHAU........................ 153 9.5. TẠO BẢN SAO CỦA ĐỐI TƯỢNG....................... 154 9.6. CUỘC ĐỜI CỦA ĐỐI TƯỢNG............................... 159 Chương 10. THÀNH VIÊN LỚP VÀ THÀNH VIÊN THỰC THỂ 164 10.1. BIẾN CỦA LỚP...................................................... 164 10.2. PHƯƠNG THỨC CỦA LỚP................................. 165 10.3. GIỚI HẠN CỦA PHƯƠNG THỨC LỚP............. 167 10.4. KHỞI TẠO BIẾN LỚP........................................... 169 10.5. MẪU THIẾT KẾ SINGLETON.............................. 170 10.6. THÀNH VIÊN BẤT BIẾN – final.......................... 171 Chương 11. NGOẠI LỆ................................................... 174 11.1. NGOẠI LỆ LÀ GÌ?.................................................. 175 11.1.1. Tình huống sự cố.......................................... 175 11.1.2. Xử lý ngoại lệ................................................ 177 11.1.3. Ngoại lệ là đối tượng.................................... 178 11.2. KHỐI try/catch........................................................ 179 11.2.1. Bắt nhiều ngoại lệ......................................... 179 11.2.2. Hoạt động của khối try/catch...................... 180 11.2.3. Khối finally – những việc dù thế nào cũng phải làm 182 3 11.2.4. Thứ tự cho các khối catch............................ 183 11.3. NÉM NGOẠI LỆ..................................................... 184 11.4. NÉ NGOẠI LỆ........................................................ 185 11.5. NGOẠI LỆ ĐƯỢC KIỂM TRA VÀ KHÔNG ĐƯỢC KIỂM TRA 189 11.6. ĐỊNH NGHĨA KIỂU NGOẠI LỆ MỚI................. 190 11.7. NGOẠI LỆ VÀ CÁC PHƯƠNG THỨC CÀI ĐÈ. 191 Chương 12. CHUỖI HÓA ĐỐI TƯỢNG VÀ VÀO RA FILE 196 12.1. QUY TRÌNH GHI ĐỐI TƯỢNG............................ 197 12.2. CHUỖI HÓA ĐỐI TƯỢNG................................... 199 12.3. KHÔI PHỤC ĐỐI TƯỢNG.................................... 202 12.4. GHI CHUỖI KÍ TỰ RA TỆP VĂN BẢN............... 205 12.4.1. Lớp File.......................................................... 206 12.4.2. Bộ nhớ đệm................................................... 207 12.5. ĐỌC TỆP VĂN BẢN.............................................. 207 12.6. CÁC DÒNG VÀO/RA TRONG Java API............. 209 Chương 13. LẬP TRÌNH TỔNG QUÁT VÀ CÁC LỚP COLLECTION 215 13.1. LỚP TỔNG QUÁT................................................. 217 13.2. PHƯƠNG THỨC TỔNG QUÁT........................... 219 13.3. CÁC CẤU TRÚC DỮ LIỆU TỔNG QUÁT TRONG JAVA API 220 13.4. ITERATOR VÀ VÒNG LẶP FOR EACH............. 222 13.5. SO SÁNH NỘI DUNG ĐỐI TƯỢNG................... 224 13.5.1. So sánh bằng................................................. 224 13.5.2. So sánh lớn hơn/nhỏ hơn............................. 226 13.6. KÍ TỰ ĐẠI DIỆN TRONG KHAI BÁO THAM SỐ KIỂU 228 Phụ lục A. DỊCH CHƯƠNG TRÌNH BẰNG JDK.......... 233 Phụ lục B. PACKAGE – TỔ CHỨC GÓI CỦA JAVA.... 236 Phụ lục C. BẢNG THUẬT NGỮ ANH-VIỆT................. 239 Tµi liÖu tham kh¶o............................................................... 241 4 Giíi thiÖu Phần mềm ngày càng lớn và phức tạp và đòi hỏi được cập nhật liên tục để đáp ứng những yêu cầu mới của người dùng. Phương pháp lập trình thủ tục truyền thống dần trở nên không đáp ứng được những đòi hỏi đó của ngành công nghiệp phần mềm. Lập trình hướng đối tượng đã ra đời trong bối cảnh như vậy để hỗ trợ sử dụng lại và phát triển các phần mềm qui mô lớn. Giáo trình này cung cấp cho sinh viên các kiến thức từ cơ bản cho đến một số kỹ thuật nâng cao về phương pháp lập trình hướng đối tượng. Giáo trình dùng cho sinh viên ngành Công nghệ thông tin đã có kiến thức căn bản về lập trình. Giáo trình sử dụng ngôn ngữ lập trình Java để minh họa và đồng thời cũng giới thiệu một số kiến thức căn bản của ngôn ngữ này. Các nội dung chính về phương pháp lập trình hướng đối tượng được trình bày trong giáo trình bao gồm lớp và đối tượng, đóng gói/che giấu thông tin, kế thừa và đa hình, xử lý ngoại lệ và lập trình tổng quát. Ngoài ra, giáo trình cũng trình bày các kiến thức về Java bao gồm các đặc trưng cơ bản của ngôn ngữ, các thư viện cơ bản và cách thức tổ chức vào/ra dữ liệu. Thay vì cách trình bày theo tính hàn lâm về một chủ đề rộng, để thuận tiện cho giảng dạy, giáo trình chọn cách trình bày theo các bài học cụ thể được sắp xếp theo trình tự kiến thức từ cơ sở đến chuyên sâu. Mỗi chủ đề có thể được giảng dạy với thời lượng 2~3 giờ lý thuyết và giờ thực hành tương ứng. Ch-¬ng 2 và Ch-¬ng 6, với nội dung là các kiến thức cơ bản về ngôn ngữ lập trình Java, tuy cần thiết nhưng không phải nội dung trọng tâm của môn học Lập trình hướng đối tượng. Các chương này, do đó, nên để sinh viên tự học. Chương 9 và Chương 10 không nhất thiết phải được dạy thành những chủ đề độc lập mà có thể được tách rải rác các nội dung kiến thức và giới thiệu kèm theo các khái niệm hướng đối tượng có liên quan, hoặc yêu cầu sinh viên tự đọc khi cần đến các kiến thức này trong quá trình thực hành. Tuy cuốn giáo trình này không trình bày sâu về lập trình Java, nhưng kiến thức về lập trình Java lại là cần thiết đối với sinh viên, ngay cả với mục đích thực hành môn học. Do đó, ngoài mục đích thực hành các nội dung liên quan đến lập trình hướng đối tượng, các bài tập thực hành của môn học này nên có thêm đóng vai trò định hướng và gợi ý giúp đỡ sinh viên tự học các chủ đề thuần túy Java mà giáo viên cho là cần thiết, chẳng hạn như học về vào ra dữ liệu đơn giản ngay từ tuần đầu tiên của môn học. Các định hướng này có thể được thể hiện ở những bài tập thực hành với những đoạn chương trình mẫu, hoặc yêu cầu tìm hiểu tài liệu API về một số lớp tiện ích. Một số bài tập cuối chương là ví dụ của dạng bài tập này. 5 Các thuật ngữ hướng đối tượng nguyên gốc tiếng Anh đã được chuyển sang tiếng Việt theo những cách khác nhau tùy các tác giả. Sinh viên cần biết thuật ngữ nguyên gốc tiếng Anh cũng như các cách dịch khác nhau đó để tiện cho việc sử dụng tài liệu tiếng Anh cũng như để liên hệ kiến thức giữa các tài liệu tiếng Việt. Vì lí do đó, giáo trình này cung cấp bảng thuật ngữ Anh-Việt với các cách dịch khác nhau tại Phụ lục C, bên cạnh Phụ lục A về công cụ lập trình JDK và Phụ lục B về tổ chức gói của ngôn ngữ Java. Các tác giả chân thành cảm ơn PGS. TS. Nguyễn Đình Hóa, TS. Trương Anh Hoàng, TS. Cao Tuấn Dũng, TS. Đặng Đức Hạnh, cũng như các đồng nghiệp và sinh viên tại Khoa Công nghệ thông tin, Trường Đại học Công nghệ đã đọc bản thảo giáo trình và có các góp ý quí báu về nội dung chuyên môn cũng như cách thức trình bày. Tuy vậy, giáo trình vẫn còn nhiều khiếm khuyết, các tác giả mong tiếp tục nhận được góp ý để hoàn thiện trong tương lai. 6 Ch−¬ng 1. më ®Çu Lập trình là công đoạn quan trọng chủ chốt và không thể thiếu để tạo ra sản phẩm phần mềm. Phần mềm càng trở nên đa dạng và ngành công nghiệp phần mềm càng phát triển thì người ta càng thấy rõ tầm quan trọng của phương pháp lập trình. Phương pháp lập trình tốt không chỉ đảm bảo tạo ra phần mềm tốt mà còn hỗ trợ thiết kế phần mềm có tính mở và hỗ trợ khả năng sử dụng lại các mô đun. Nhờ đó chúng ta có thể dễ dàng bảo trì, nâng cấp phần mềm cũng như giảm chi phí phát triển phần mềm. Trong những thập kỷ 1970, 1980, phương pháp phát triển phần mềm chủ yếu là lập trình có cấu trúc (structured programming). Cách tiếp cận cấu trúc đối với việc thiết kế chương trình dựa trên chiến lược chia để trị: Để giải một bài toán lớn, chúng ta tìm cách chia nó thành vài bài toán nhỏ hơn và giải riêng từng bài; để giải mỗi bài, hãy coi nó như một bài toán mới và có thể tiếp tục chia nó thành các bài toán nhỏ hơn; cuối cùng, ta sẽ đi đến những bài toán có thể giải ngay được mà không cần phải chia tiếp. Cách tiếp cận này được gọi là lập trình từ trên xuống (top-down programming). Lập trình từ trên xuống là một phương pháp tốt và đã được áp dụng thành công cho phát triển rất nhiều phần mềm. Tuy nhiên, cùng với sự đa dạng và phức tạp của phần mềm, phương pháp này bộc lộ những hạn chế. Trước hết, nó hầu như chỉ đáp ứng việc tạo ra các lệnh hay là các quy trình để giải quyết một bài toán. Dần dần, người ta nhận ra rằng thiết kế các cấu trúc dữ liệu cho một chương trình có tầm quan trọng không kém việc thiết kế các hàm/thủ tục và các cấu trúc điều khiển. Lập trình từ trên xuống không quan tâm đủ đến dữ liệu mà chương trình cần xử lý. Thứ hai, với lập trình từ trên xuống, chúng ta khó có thể tái sử dụng các phần của chương trình này cho các chương trình khác. Bằng việc xuất phát từ một bài toán cụ thể và chia nó thành các mảnh sao cho thuận, cách tiếp cận này có xu hướng tạo ra một thiết kế đặc thù cho chính bài toán đó. Chúng ta khó có khả năng lấy một đoạn mã lớn từ một chương trình cũ lắp vào một dự án mới mà không phải sửa đổi lớn. Việc xây dựng các chương trình chất lượng cao là khó khăn và tốn kém, do đó những nhà phát triển phần mềm luôn luôn muốn tái sử dụng các sản phẩm cũ. Thứ ba, môi trường hoạt động trong thực tế của các ứng dụng luôn thay đổi. Dẫn đến việc yêu cầu phần mềm cũng phải liên tục thay đổi theo để đáp ứng nhu cầu của người dùng nếu không muốn phần mềm bị đào thải. Do đó, một thiết kế linh hoạt mềm dẻo là cái mà các nhà phát triển phần mềm mong muốn. Phương pháp tiếp cận từ dưới lên (bottom-up) hỗ trợ tốt hơn cho tính linh hoạt mềm dẻo đó. Trong thực tế, thiết kế và lập trình từ trên xuống thường được kết hợp với thiết kế và lập trình từ dưới lên. Trong tiếp cận từ dưới lên, từ các vấn đề mà ta đã biết 7 cách giải và có thể đã có sẵn các thành phần tái sử dụng được chúng ta xây dựng dần theo hướng lên trên, hướng đến một giải pháp cho bài toán tổng. Các thành phần tái sử dụng được nên có tính mô-đun hóa cao nhất có thể. Mỗi mô-đun là một thành phần của một hệ thống lớn hơn, nó tương tác với phần còn lại của hệ thống theo một cách đơn giản và được quy ước chặt chẽ. Ý tưởng ở đây là một mô-đun có thể được "lắp vào" một hệ thống. Chi tiết về những gì xảy ra bên trong mô-đun không cần được xét đến đối với hệ thống nói chung, miễn là mô-đun đó hoàn thành tốt vai trò được giao. Đây gọi là che giấu thông tin (information hiding), một trong những nguyên lý quan trọng nhất của công nghệ phần mềm. Một dạng thường thấy của các mô-đun phần mềm là nó chứa một số dữ liệu kèm theo một số hàm/thủ tục để xử lý dữ liệu đó. Ví dụ, một mô-đun sổ địa chỉ có thể chứa một danh sách các tên và địa chỉ, kèm theo là các hàm/thủ tục để thêm một mục tên mới, in nhãn địa chỉ…Với cách này, dữ liệu được bảo vệ vì nó chỉ được xử lý theo các cách đã được biết trước và được định nghĩa chặt chẽ. Ngoài ra, nó cũng tạo thuận lợi cho các chương trình sử dụng mô-đun này, vì các chương trình đó không phải quan tâm đến chi tiết biểu diễn dữ liệu bên trong mô-đun. Thông tin về biểu diễn dữ liệu được che giấu. Các mô-đun hỗ trợ dạng che giấu thông tin này bắt đầu trở nên phổ biến trong các ngôn ngữ lập trình đầu thập kỷ 1980. Từ đó, một hình thức tiên tiến hơn của chính ý tưởng đó đã lan rộng trong ngành công nghệ phần mềm. Cách tiếp cận đó được gọi là lập trình hướng đối tượng (object-oriented programming), thường được gọi tắt là OOP. Câu chuyện tưởng tượng sau đây1 minh họa phần nào sự khác biệt giữa lập trình thủ tục và lập trình hướng đối tượng trong thực tế của ngành công nghệ phàn mềm. Có hai lập trình viên nhận được cùng một đặc tả hệ thống và được yêu cầu xây dựng hệ thống đó, thi xem ai là người hoàn thành sớm nhất. Dậu là người chuyên dùng phương pháp lập trình thủ tục, còn Tuất quen dùng lập trình hướng đối tượng. Cả Dậu và Tuất đều cho rằng đây là nhiệm vụ đơn giản. Đặc tả như sau: 1 Nguồn: Head First Java, 2nd Edition. 8 Dậu tính toán, "Chương trình này phải làm những gì? Ta cần đến những thủ tục nào?" Anh tự trả lời, "xoay và chơi nhạc." Và anh bắt tay vào viết các thủ tục đó. Chương trình không phải là một loạt các thủ tục thì nó là cái gì? Trong khi đó, Tuất nghĩ, "Trong chương trình này có những thứ gì...đâu là những nhân tố chính?" Đầu tiên, anh ta nghĩ đến những Hình vẽ. Ngoài ra, anh còn nghĩ đến những đối tượng khác như người dùng, âm thanh, và sự kiện click chuột. Nhưng anh đã có sẵn thư viện mã cho mấy đối tượng đó, nên anh tập trung vào việc xây dựng các Hình vẽ. Dậu đã quá thạo với công việc kiểu này rồi, anh ra bắt tay vào viết các thủ tục quan trọng và nhanh chóng hoàn thành hai thủ tục xoay (rotate) và chơi nhạc (playSound): rotate(shapeNum) { // cho hình xoay 360o } playSound(shapeNum) { // dùng shapeNum để tra xem cần chơi file AIF nào // và chơi file đó } Còn Tuất ngồi viết ba lớp, mỗi lớp dành cho một hình. Dậu vừa nghĩ rằng mình đã thắng cuộc thì sếp nói "Về mặt kĩ thuật thì Dậu xong trước, nhưng ta phải bổ sung một chút xíu nữa vào chương trình." Hai người đã quá quen với chuyện đặc tả thay đổi – chuyện thường ngày trong ngành. Đặc tả được bổ sung nội dung sau: Đối với Dậu, thủ tục rotate vẫn ổn, mã dùng một bảng tra cứu để khớp giá trị shapeNum với một hình đồ họa cụ thể. Nhưng playSound thì phải sửa. Rốt cục không phải sửa nghiêm trọng, nhưng Dậu vẫn thấy không thoải mái khi phải động vào sửa phần mã đã được test xong từ trước. Anh biết, dù quản lý dự án có nói gì đi chăng nữa, đặc tả thay đổi suốt. 9 Còn Tuất thì thản nhiên vừa nhâm nhi cà phê vừa viết một lớp mới. Điều anh thích nhất về OOP là anh không phải sửa gì ở phần mã đã được test và bàn giao. Anh nghĩ về những ích lợi của OOP và lẩm bẩm "Tính linh hoạt, khả năng mở rộng,...". Dậu cũng vừa kịp hoàn thành chỉ một lát trước Tuất. Nhưng nụ cười của anh vụt tắt khi nhìn thấy bộ mặt của sếp và nghe thấy giọng sếp vẻ thất vọng "không được rồi, amoeba thực ra không xoay kiểu này..." Thì ra cả hai lập trình viên đều đã viết đoạn xoay hình theo cách: (1) xác định hình chữ nhật bao hình; (2) xác định tâm của hình chữ nhật đó và xoay hình quanh điểm đó. Nhưng hình trùng biến hình thì lại cần xoay quanh một điểm ở một đầu mút, như kiểu kim đồng hồ. "Mình tèo rồi." Dậu ngán ngẩm. "Tuy là, ừm, có thể thêm một lệnh if/else nữa vào thủ tục rotate, rồi hard-code tâm xoay cho amoeba. Làm vậy chắc là sẽ không làm hỏng đoạn nào khác." Nhưng một giọng nói trong đầu Dậu thì thào, "Nhầm to! Cậu có chắc là đặc tả sẽ không thay đổi lần nữa không đấy?" Cuối cùng Dậu chọn cách bổ sung tham số về tâm xoay vào cho thủ tục rotate. Rất nhiều đoạn mã đã bị ảnh hưởng. Phải test lại, dịch lại cả đống mã. Có những đoạn trước chạy tốt thì nay không chạy được nữa. rotate(shapeNum, xPt, yPt) { 10 //nếu hình không phải amoeba, // tính tâm xoay // dựa trên một hình chữ nhật // rồi xoay hình //nếu không // dựng xPt và yPt làm offset tâm xoay // rồi xoay hình } Còn Tuất, không chần chừ chút nào, anh sửa luôn phương thức rotate, nhưng chỉ sửa ở lớp Amoeba mà thôi. Tuất không hề động đến các đoạn mã đã dịch, đã chạy và đã test tại các phần khác trong chương trình. Để cho Amoeba một tâm xoay, anh thêm một thuộc tính mà tất cả các hình trùng biến hình sẽ có. Anh nhanh chóng sửa, test, và bàn giao mã cho sếp. "Không nhanh thế được!" Dậu tìm thấy một nhược điểm trong cách tiếp cận của Tuất, và anh chắc mẩm nó sẽ giúp anh chuyển bại thành thắng. Dậu thấy mã của Tuất bị lặp, rotate có mặt ở cả bốn thứ hình, thiết kế này có gì hay ho khi phải bảo trì cả bốn phương thức rotate khác nhau? Tuất giải thích: Dậu chưa nhìn thấy đặc điểm quan trọng của thiết kế, đó là quan hệ thừa kế. Bốn lớp có những đặc điểm chung, những đặc điểm đó được tách ra và đặt trong một lớp mới tên là Shape. Các lớp kia, mỗi lớp đều được xem là "thừa kế từ lớp Shape". Nói cách khác, nếu lớp Shape có những chức năng gì thì các lớp kia tự động có các chức năng đó. 11 Tuy nhiên, Amoeba có tâm xoay khác và chơi file nhạc khác. Lớp Amoeba cài đè các hoạt động rotate và playSound đã được thừa kế từ Shape bằng cách định nghĩa lại các thủ tục này. Và khi chạy, hệ thống tự biết là cần dùng phiên bản được viết tại Amoeba thay vì dùng phiên bản thừa kế từ Shape. Đó là đặc điểm thú vị của phương pháp hướng đối tượng. Khi ta cần yêu cầu một hình nào đó xoay, tam giác hay amoeba, ta chỉ việc gọi phương thức rotate cho đối tượng đó, và hệ thống sẽ tự biết phải làm gì, trong khi phần còn lại của chương trình không biết hoặc không quan tâm đến việc đối tượng đó xoay kiểu gì. Và khi ta cần bổ sung một cái gì đó mới vào chương trình, ta chỉ phải viết một lớp mới cho loại đối tượng mới, từ đó, các đối tượng mới sẽ có cách hành xử của riêng chúng. 1.1. KHÁI NIỆM CƠ BẢN Hướng đối tượng là kĩ thuật mô hình hóa một hệ thống thế giới thực trong phần mềm dựa trên các đối tượng. Đối tượng (object) là khái niệm trung tâm của OOP, nó là một mô hình của một thực thể hay khái niệm trong thế giới thực. Việc mô hình hóa này bao gồm xác định các đối tượng tham gia bài toán – những cái làm nhiệm vụ gì đó hoặc bị làm gì đó. Lập trình theo kiểu hướng đối tượng là hoạt động định nghĩa các thể loại của các đối tượng đó ở hình thức các khuôn mẫu để tạo ra chúng. Trong thời gian chạy, một chương trình OOP chính là một tập các đối tượng gửi thông điệp cho nhau để yêu cầu dịch vụ và thực hiện dịch vụ khi được yêu cầu. Việc một đối tượng thực hiện một dịch vụ có thể dẫn đến việc nó thay đổi trạng thái của bản thân. Một ví dụ có tính chất gần với thế giới thực: ông A đến rút tiền tại máy ATM. Ta có các đối tượng: ông A, máy ATM, cơ sở dữ liệu ngân hàng, và tài khoản của ông A. Trình tự diễn ra như sau: Ông A cho thẻ ngân hàng vào khe máy ATM; 12 đối tượng ATM yêu cầu cơ sở dữ liệu ngân hàng cung cấp đối tượng tài khoản của ông A; ông A yêu cầu rút 100.000 đồng; đối tượng ATM yêu cầu đối tượng tài khoản trừ đi 100.000 đồng. Như vậy giao dịch này bao gồm chuỗi các yêu cầu dịch vụ và việc các đối tượng thực hiện các yêu cầu đó, đồng thời thay đổi trạng thái của mình (tài khoản ông A bị bớt tiền, ông A có thêm tiền, dữ liệu nhật trình ATM có thêm thông tin về một giao dịch). 1.2. ĐỐI TƯỢNG VÀ LỚP Gần như bất cứ thứ gì cũng có thể được mô hình hóa bằng một đối tượng. Chẳng hạn, một màu, một hình vẽ, một cái nhiệt kế. Mỗi đối tượng có một tập các thuộc tính (attribute) như các giá trị hay trạng thái để mô hình hóa đối tượng đó. Chẳng hạn, một cái nhiệt kế có thể có thuộc tính là vị trí hiện tại của nó và trạng thái hiện tại tắt hay bật, các thuộc tính một màu có thể là giá trị của ba thành phần RGB của nó. Một cái ô tô có các thuộc tính như: lượng xăng hiện có, tốc độ hiện tại, biển số. Mỗi đối tượng có một tập các trách nhiệm mà nó thực hiện bằng cách cung cấp dịch vụ cho các đối tượng khác. Các dịch vụ này có thể cho phép truy vấn thông tin hoặc làm thay đổi trạng thái của đối tượng. Ví dụ, nhiệt kế cho phép truy vấn về tình trạng tắt/bật của nó; đáp ứng các yêu cầu về nhiệt độ hiện hành mà nó đo được, yêu cầu tắt/bật. Một cái ô tô cho phép tăng ga, giảm ga để tăng/giảm tốc độ di chuyển. Đối với thiết kế tốt, các đối tượng bên ngoài không phải quan tâm xem một đối tượng nào đó cài đặt một dịch vụ như thế nào, mà chỉ cần biết đối tượng đó cung cấp những dịch vụ nào (hay nó có những trách nhiệm gì). Chẳng hạn, người lái xe không cần biết cơ chế chuyển đổi từ lực nhấn lên chân đạp ga sang sự thay đổi về tốc độ của ô tô. Hình 1.1: Các đối tượng ô tô và đặc điểm chung của chúng. Trong mỗi ứng dụng, các đối tượng có đặc điểm tương tự nhau, chẳng hạn các tài khoản ngân hàng, các sinh viên, các máy ATM, những chiếc ô tô được xếp vào cùng một nhóm, đó là lớp (class). Mỗi lớp là đặc tả các đặc điểm của các đối tượng 13 thuộc lớp đó. Cụ thể, một định nghĩa lớp mô tả tất cả các thuộc tính của các đối tượng thành viên của lớp đó và các phương thức thực thi hành vi của các đối tượng đó. Ví dụ, ta có thể có nhiều đối tượng ô tô với thông số khác nhau về lượng xăng hiện có, tốc độ hiện tại, và biển số xe; định nghĩa lớp ô tô mô tả đặc điểm chung của các thông số đó cùng với các phương thức thực hiện các hoạt động tăng tốc, giảm tốc. Hình 1.2: Lớp Automobile vẽ bằng kí pháp UML Quan hệ giữa lớp và đối tượng gần giống như quan hệ giữa kiểu dữ liệu và các biến thuộc kiểu dữ liệu đó. Các đối tượng được tạo ra khi chương trình chạy, và lớp là khuôn mẫu mà từ đó có thể tạo ra các đối tượng thuộc lớp đó. Mỗi đối tượng được tạo ra từ một lớp được gọi là một thực thể (instance) của lớp đó. Một chương trình khi được viết là sự kết hợp của các lớp khác nhau. Còn khi chạy, nó là một tập hợp các đối tượng hoạt động và tương tác với nhau, các đối tượng này được sinh ra từ các lớp cấu thành nên chương trình đó. Mỗi đối tượng đều có một thời gian sống. Trong khi chương trình chạy, đối tượng được tạo và khởi tạo giá trị theo yêu cầu. Ngay khi một đối tượng được tạo ra, hệ thống tự động gọi một hàm khởi tạo (constructor) để khởi tạo giá trị cho các thuộc tính của đối tượng. Kể từ đó, đối tượng bắt đầu tồn tại, nó gửi và nhận các thông điệp, và cuối cùng thì nó bị hủy đi khi không còn cần đến nữa. Trong khi đối tượng tồn tại, nó giữ định danh và trạng thái của mình. Mỗi đối tượng có một định danh riêng và có bộ thuộc tính riêng, độc lập với các đối tượng khác thuộc cùng một lớp. Trong thực tế, mỗi đối tượng có vị trí riêng trong bộ nhớ. Các đối tượng dùng các thông điệp (message) để liên lạc với nhau. Nhìn từ phương diện lập trình, việc gửi một thông điệp tới một đối tượng chính là gọi một phương thức của đối tượng đó, còn việc một đối tượng nhận được một thông điệp chính là việc một phương thức của nó được một đối tượng khác gọi. Chương trình khi chạy là một tập các đối tượng, mỗi đối tượng gửi thông điệp cho các đối tượng khác trong hệ thống và đáp ứng các thông điệp mà mình nhận được. Thông thường, một thông điệp được gửi bằng một lời gọi phương thức trong chương trình. Tuy nhiên, các thông điệp có thể xuất phát từ hệ điều hành hoặc môi trường chạy chương trình. Chẳng hạn khi người dùng click chuột vào một nút bấm tại một cửa sổ chương trình, một thông điệp sẽ được gửi đến đối tượng điều khiển nút bấm đó thông báo rằng cái nút đó đã bị nhấn. 14 1.3. CÁC NGUYÊN TẮC TRỤ CỘT Lập trình hướng đối tượng có ba nguyên tắc trụ cột: đóng gói, thừa kế và đa hình, còn trừu tượng hóa là khái niệm nền tảng. Trừu tượng hóa (abstraction) là một cơ chế cho phép biểu diễn một tình huống phức tạp trong thế giới thực bằng một mô hình được đơn giản hóa. Nó bao gồm việc tập trung vào các tính chất quan trọng của một đối tượng khi phải làm việc với lượng lớn thông tin. Ví dụ, đối với một con mèo trong ngữ cảnh một cửa hàng bán thú cảnh, ta có thể tập trung vào giống mèo, màu lông, cân nặng, tuổi, đã tiêm phòng dại hay chưa, và bỏ qua các thông tin khác như dung tích phổi, nồng độ đường trong máu, huyết áp, còn đối với một con mèo trong ngữ cảnh bệnh viện thú y thì lại là một chuyện khác. Các đối tượng ta thiết kế trong chương trình OOP sẽ là các trừu tượng hóa theo nghĩa đó, ta bỏ qua nhiều đặc điểm của đối tượng thực và chỉ tập trung vào các thuộc tính quan trọng cho việc giải một bài toán cụ thể. Người ta gọi một trừu tượng hóa là một mô hình của một đối tượng hoặc khái niệm trong thế giới thực. Trừu tượng hóa là một trong những công cụ cơ bản của tất cả các phương pháp lập trình, không chỉ lập trình hướng đối tượng. Khi viết một chương trình giải một bài toán của thế giới thực, trừu tượng hóa là một cách để mô hình hóa bài toán đó. Ví dụ, khi ta viết một chương trình quản lý sổ địa chỉ, ta sẽ dùng các trừu tượng hóa như tên, địa chỉ, số điện thoại, thứ tự bảng chữ cái, và các khái niệm liên quan tới một sổ địa chỉ. Ta sẽ định nghĩa các thao tác để xử lý dữ liệu chẳng hạn như thêm một mục tên mới hoặc sửa một địa chỉ. Trong ngữ cảnh lập trình, trừu tượng hóa là mô hình hóa thế giới thực theo cách mà nó có thể được cài đặt dưới dạng một chương trình máy tính. Phương pháp hướng đối tượng trừu tượng hóa thế giới thực thành các đối tượng và tương tác giữa chúng với các đối tượng khác. Việc mô hình hóa trở thành mô hình hóa các đối tượng tham gia bài toán – một cái nhiệt kế, một người chủ tài khoản ngân hàng, một sổ địa chỉ… mỗi đối tượng cần có đủ các thuộc tính và phương thức để thực hiện được tất cả các dịch vụ mà nó được yêu cầu. Đóng gói (encapsulation): Các trừu tượng hóa của những gì có liên quan đến nhau được đóng gói vào trong một đơn vị duy nhất. Các trạng thái và hành vi của các trừu tượng hóa được bọc lại trong một khối gọi là lớp. Cụ thể, sau khi đã xác định được các đối tượng, rồi đến các thuộc tính và hành động của mỗi đối tượng, mục tiêu là đóng gói trong mỗi đối tượng các tính năng cần thiết để nó có thể thực hiện được vai trò của mình trong chương trình. Thí dụ, một đối tượng nhiệt kế cần có những gì cần thiết để có thể đo nhiệt độ, lưu trữ số liệu của các lần đo nhiệt độ trước và cho phép truy vấn các số liệu này. Định nghĩa lớp là công cụ lập trình chính yếu cho việc thực hiện nguyên tắc đóng gói. Một lớp là mô tả về một tập hợp các đối tượng có cùng các thuộc tính, hành vi. 15 Thuộc tính (attribute) dùng để lưu trữ thông tin trạng thái của một đối tượng. Một thuộc tính có thể chỉ đơn giản là một biến Boolean lưu trữ trạng thái tắt hoặc bật, hay phức tạp hơn khi chính nó lại là một đối tượng khác. Các thuộc tính được khai báo trong định nghĩa lớp và được gọi là các biến của thực thể (instance variable), gọi tắt là biến thực thể. Chúng còn được gọi là các thành viên dữ liệu (data member), hay trường (field). Trạng thái (state) phản ánh các giá trị hiện tại của các thuộc tính của một đối tượng và là kết quả của hành vi của đối tượng đó theo thời gian. Hành vi (behavior) là hoạt động của một đối tượng mà có thể nhìn thấy được từ bên ngoài. Trong đó có việc đối tượng thay đổi trạng thái ra sao hoặc việc nó trả về thông tin trạng thái khi nó được thông điệp yêu cầu. Phương thức (method) là một thao tác hay dịch vụ được thực hiện đối với đối tượng khi nó nhận thông điệp tương ứng. Các phương thức cài đặt hành vi của đối tượng và được định nghĩa trong định nghĩa lớp. Phương thức còn được gọi bằng các cái tên khác như: hàm thành viên (member function) – gọi tắt là 'hàm', thao tác (operation), dịch vụ (service). Khái niệm đóng gói còn đi kèm với khái niệm che giấu thông tin (information hiding) nghĩa là che giấu các chi tiết bên trong của một đối tượng khỏi thế giới bên ngoài. Chẳng hạn khi dùng một cái cầu dao điện, đối với người sử dụng, nó chỉ là một cái hộp mà khi gạt cần sẽ có tác dụng ngắt và nối điện và cái hộp có khả năng tự ngắt điện khi quá tải. Người dùng không biết và không cần biết các mạch điện bên trong được thiết kế ra sao, cơ chế phát hiện quá tải như thế nào. Những chi tiết đó được giấu bên trong, còn từ bên ngoài ta chỉ nhìn thấy cầu dao là một cái hộp có cần gạt. Nói theo phương diện lập trình, nhìn từ bên ngoài một mô-đun chỉ thấy được các giao diện. Các lập trình viên tự do cài đặt chi tiết bên trong, với ràng buộc duy nhất là tuân theo giao diện đã được quy ước từ trước. Ta có thể thực hiện nguyên tắc đóng gói với tất cả các ngôn ngữ lập trình hướng đối tượng cũng như các ngôn ngữ thủ tục. Tuy nhiên, chỉ các ngôn ngữ hướng đối tượng mới cung cấp cơ chế cho phép che giấu thông tin, ngăn không cho bên ngoài truy nhập vào chi tiết bên trong của mô-đun. Thừa kế (inheritance) là quan hệ mang tính phân cấp mà trong đó các thành viên của một lớp được kế thừa bởi các lớp được dẫn xuất trực tiếp hoặc gián tiếp từ lớp đó. Đây là cơ chế cho phép định nghĩa một lớp mới dựa trên định nghĩa của một lớp có sẵn, sao cho tất cả các thành viên của lớp "cũ" (lớp cơ sở hay lớp cha) cũng có mặt trong lớp mới (lớp dẫn xuất hay lớp con) và các đối tượng thuộc lớp mới có thể được sử dụng thay cho đối tượng của lớp cũ ở bất cứ đâu. Thừa kế là một hình thức tái sử dụng phần mềm, trong đó một lớp mới được xây dựng bằng cách hấp thụ các thành viên của một lớp có sẵn và bổ sung những tính năng mới hoặc sửa tính năng có sẵn. Nói cách khác, xuất phát từ một lớp mô hình hóa một khái niệm tổng quát hơn, 16 chẳng hạn Shape, ta có thể dùng quan hệ thừa kế để xây dựng các lớp mô hình hóa các khái niệm cụ thể hơn, chẳng hạn Circle, Triangle. Bằng cách này, ta có thể sử dụng giao diện cũng như cài đặt của lớp cũ cho lớp mới. Đa hình (polymorphism), theo nghĩa tổng quát, là khả năng tồn tại ở nhiều hình thức. Trong hướng đối tượng, đa hình đi kèm với quan hệ thừa kế và nó có nghĩa rằng cùng một cái tên có thể được hiểu theo các cách khác nhau tùy từng tình huống. Các đối tượng thuộc các lớp dẫn xuất khác nhau có thể được đối xử như nhau, như thể chúng là các đối tượng thuộc lớp cơ sở, chẳng hạn có thể đặt các đối tượng Triangle và Circle trong cùng một cấu trúc dữ liệu dành cho Shape, hoặc dùng cùng một lời gọi hàm rotate cho các đối tượng Triangle hay Circle. Và khi nhận được cùng một thông điệp đó, các đối tượng thuộc các lớp khác nhau hiểu nó theo những cách khác nhau. Ví dụ, khi nhận được thông điệp "rotate", các đối tượng Triangle và Amoeba thực hiện các phương thức rotate() khác nhau. 17 Bài tập 1. Điền từ thích hợp vào chỗ trống trong mỗi câu sau: a) Quan hệ giữa một ngôi nhà và một bản thiết kế tương tự như quan hệ giữa một ________ với một lớp. b) Khi mỗi đối tượng của một lớp giữ một bản riêng của một thuộc tính, trường dữ liệu đại diện cho thuộc tính đó được gọi là _________ 2. Chú trọng đến các tính chất quan trọng trong khi bỏ qua các chi tiết ít quan trọng được gọi là A. Trừu tượng hóa B. Đa hình C. Đóng gói D. Che giấu thông tin 3. "Cùng một thông điệp được hiểu theo các cách khác nhau tùy theo đối tượng nhận được thông điệp đó thuộc lớp nào" là đặc điểm của khái niệm nào? A. Đóng gói B. Đa hình C. Thừa kế D. Tái sử dụng 4. "Đối tượng thuộc lớp con có thể được đối xử như đối tượng thuộc lớp cha" là đặc điểm của khái niệm nào? A. Trừu tượng hóa B. Đa hình C. Đóng gói D. Che giấu thông tin E. Thừa kế 5. "Che đi các chi tiết cài đặt và chỉ cho thấy giao diện của mô-đun" là đặc điểm của khái niệm nào? A. Trừu tượng hóa B. Đa hình C. Đóng gói D. Tái sử dụng 18 19 Ch−¬ng 2. Ng¤n ng÷ lËp tr×nh Java Java được hãng Sun Microsystems2 thiết kế năm 1991 như là một ngôn ngữ dành cho các chương trình nhúng (embedded program) chạy trên các thiết bị điện tử gia dụng như lò vi sóng và các hệ thống an ninh gia đình. Tuy nhiên, sự phát triển và lan rộng của Internet và World Wide Web (WWW) đã khiến Sun chuyển hướng Java từ một ngôn ngữ cho lập trình nhúng sang ngôn ngữ lập trình ứng dụng Web. Đến nay, Java đã trở thành ngôn ngữ lập trình ứng dụng phổ thông và là một trong những ngôn ngữ quan trọng nhất để phát triển các ứng dụng Web và Internet. 2.1. ĐẶC TÍNH CỦA JAVA Java là ngôn ngữ hướng đối tượng. Các ngôn ngữ hướng đối tượng chia chương trình thành các mô-đun riêng biệt, được gọi là các đối tượng, chúng đóng gói dữ liệu và các thao tác của chương trình. Các khái niệm lập trình hướng đối tượng và thiết kế hướng đối tượng nói về phong cách tổ chức chương trình đang ngày càng được lựa chọn cho việc xây dựng các hệ thống phần mềm phức tạp. Không như ngôn ngữ C++, trong đó các đặc điểm hướng đối tượng được gắn thêm vào ngôn ngữ C, ngay từ đầu Java được thiết kế là một ngôn ngữ hướng đối tượng. Java là ngôn ngữ có tính chắc chắn. Không như nhiều ngôn ngữ lập trình khác, lỗi trong các chương trình Java không gây sự cố hệ thống (system crash). Một số đặc tính của ngôn ngữ còn cho phép phát hiện nhiều lỗi tiềm tàng trước khi chương trình chạy. Java có tính độc lập nền tảng (platform independent). Một nền tảng (platform) ở đây có nghĩa một hệ thống máy tính với hệ điều hành cụ thể, chẳng hạn như một hệ thống Windows hay Macintosh. Thương hiệu của Java là "Write once, run anywhere" (Viết một lần, chạy bất cứ đâu). Có nghĩa là một chương trình Java có thể chạy trên các nền tảng khác nhau mà không phải dịch lại. Một số ngôn ngữ bậc cao khác không có được đặc tính này. Tính khả chuyển, hay khả năng chạy trên hầu như tất cả các nền tảng, còn là nguyên do cho việc Java rất phù hợp cho các ứng dụng Web. Java là ngôn ngữ phân tán. Các chương trình có thể được thiết kế để chạy trên mạng máy tính, một chương trình bao gồm những lớp đặt rải rác tại các máy khác nhau trong mạng. Bên cạnh ngôn ngữ, Java còn có một bộ sưu tập phong phú các thư viện mã đã được thiết kế để dùng trực tiếp cho các loại ứng dụng cụ thể, tạo 2 Sun Microsystems đã nhập vào hãng Oracle từ năm 2010. 20 điều kiện thuận lợi cho việc xây dựng các hệ thống phần mềm cho Internet và WWW. Java là một ngôn ngữ an toàn. Được thiết kế để dùng cho các mạng máy tính, Java có những đặc tính tự bảo vệ trước những phần mã không được tin cậy – những phần có thể đưa virus vào hệ thống hoặc gây rối hệ thống bằng cách nào đó. Ví dụ, khi một chương trình Web viết bằng Java đã được tải xuống trình duyệt máy tính, chúng bị cấm đọc và ghi thông tin tại máy tính. 2.1.1. Máy ảo Java – Java Virtual Machine Ngôn ngữ máy bao gồm những chỉ thị (instruction) rất đơn giản mà CPU máy tính có thể thực hiện trực tiếp. Tuy nhiên, hầu hết các chương trình đều được viết bằng các ngôn ngữ lập trình bậc cao như Java hay C++. Một chương trình viết bằng ngôn ngữ bậc cao cần được dịch sang ngôn ngữ máy trước khi có thể được chạy trên máy tính. Việc dịch này do trình biên dịch thực hiện. Để chạy trên các loại máy tính với các ngôn ngữ máy khác nhau, cần đến các trình biên dịch phù hợp với loại ngôn ngữ máy đó. Có một lựa chọn khác thay vì biên dịch chương trình viết bằng ngôn ngữ bậc cao. Thay vì dùng một trình biên dịch để dịch thẳng toàn bộ chương trình, ta có thể dùng một trình thông dịch, nó dịch từng chỉ thị một và chỉ dịch khi cần đến. Một trình thông dịch là một chương trình hoạt động gần như một CPU với một dạng chu trình nạp-và-thực-thi (fetch-and-execute). Để thực thi một chương trình, trình thông dịch lặp đi lặp lại chuỗi công việc: đọc một chỉ thị từ trong chương trình, xác định xem cần làm gì để thực hiện chỉ thị đó, và rồi thực hiện các lệnh mã máy thích hợp để thực hiện chỉ thị đó. Một công dụng của trình thông dịch là để thực thi các chương trình viết bằng ngôn ngữ bậc cao, chẳng hạn như ngôn ngữ Lisp. Công dụng thứ hai là chúng cho phép ta chạy một chương trình ngôn ngữ máy dành cho một loại máy tính này trên một loại máy tính hoàn toàn khác. Ví dụ, có một chương trình tên là "Virtual PC" chạy trên các máy tính cài hệ điều hành Mac OS, đó là một trình thông dịch thực thi các chương trình mã máy viết cho các máy tính tương thích IBM PC. Nếu ta chạy "Virtual PC" trên một máy Mac OS, ta có thể chạy bất cứ chương trình PC nào, trong đó có cả các chương trình viết cho Windows. Những người thiết kế Java chọn cách tổ hợp giữa trình biên dịch và trình thông dịch. Các chương trình viết bằng Java được biên dịch thành mã máy, nhưng đây là loại ngôn ngữ máy dành cho loại máy tính không tồn tại – loại máy "ảo" này được gọi là Máy ảo Java (Java Virtual Machine – JVM). Ngôn ngữ máy dành cho máy ảo Java được gọi là Java bytecode, hay ngắn gọn là bytecode. Để chạy được các chương trình Java trên một loại máy tính bất kì, người ta chỉ cần một trình thông dịch dành cho Java bytecode, trình thông dịch này giả lập máy ảo Java theo kiểu mà Virtual PC giả lập một máy tính PC. Máy ảo Java cũng chính là tên gọi dành cho trình thông 21 dịch bytecode thực hiện nhiệm vụ giả lập, do đó ta nói rằng một máy tính cần một máy ảo Java để chạy các chương trình Java. Hình 2.1: Biên dịch và thông dịch đối với các chương trình Java Tất nhiên, mỗi loại máy tính cần một trình thông dịch Java bytecode khác, nhưng một khi đã có một trình thông dịch như vậy, nó có thể chạy một chương trình Java bytecode bất kì. Và cũng chính chương trình Java bytecode đó có thể chạy trên bất cứ máy tính nào có một trình thông dịch Java bytecode. Đây chính là một trong các đặc điểm quan trọng của Java: một chương trình sau khi biên dịch có thể chạy trên nhiều loại máy tính khác nhau. Có nhiều lý do tại sao nên dùng mã trung gian là Java bytecode thay cho việc phân phát mã nguồn chương trình Java và để cho mỗi người tự biên dịch nó sang mã máy của máy tính họ đang dùng. Thứ nhất, trình biên dịch là một chương trình phức tạp trong khi trình thông dịch chỉ là một chương trình nhỏ và đơn giản. Viết một trình thông dịch cho một loại máy tính mới dễ hơn là viết một trình biên dịch. Thứ hai, nhiều chương trình Java cần được tải xuống từ mạng máy tính. Việc này dẫn đến các mối quan tâm dễ thấy về bảo mật: ta không muốn tải về và chạy một chương trình sẽ phá hoại máy tính hoặc các file trong máy tính của ta. Trình thông dịch bytecode hoạt động với vai trò bộ đệm giữa máy tính của ta và chương trình ta tải về. Nó có thể bảo vệ ta khỏi các hành động nguy hiểm tiềm tàng của chương trình đó. Khi Java còn là một ngôn ngữ mới, nó đã bị chỉ trích là chạy chậm. Do Java bytecode được thực thi bởi một trình thông dịch, có vẻ như các chương trình bytecode không bao giờ có thể chạy nhanh bằng các chương trình đã được biên dịch ra ngôn ngữ máy của chính máy tính mà chương trình đang chạy trên đó. Tuy nhiên, vấn đề này đã được giải quyết gần như toàn bộ bằng việc sử dụng trình biên dịch JIT (just-in-time compiler) cho việc thực thi Java bytecode. Trình biên dịch JIT dịch Java bytecode thành mã máy. Nó làm việc này trong khi thực thi chương trình. Cũng như một trình thông dịch thông thường, đầu vào cho một trình biên dịch JIT là một chương trình Java bytecode, và nhiệm vụ của nó là thực thi chương trình đó. Nhưng trong khi thực thi chương trình, nó dịch một phần của chương trình ra mã máy. Những phần được biên dịch này khi đó có thể được thực thi nhanh hơn là so 22 với khi chúng được thông dịch. Do một phần của chương trình thường được thực thi nhiều lần trong khi chương trình chạy, một trình biên dịch JIT có thể cải thiện đáng kể tổng thời gian chạy của chương trình. 2.1.2. Các nền tảng Java Hãng Sun đã định nghĩa và hỗ trợ bốn bản Java hướng đến các môi trường ứng dụng khác nhau. Nhiều API (giao diện lập trình ứng dụng) của Java cũng được phân ra thành nhóm theo từng nền tảng. Bốn nền tảng đó là: 1. Java Card dành cho thẻ thông minh (smartcard) và các thiết bị nhớ nhỏ tương tự. Thẻ SIM và thẻ ATM có sử dụng nền tảng này. 2. Java Platform, Micro Edition (Java ME) dành cho các môi trường hệ thống nhúng, chẳng hạn như điện thoại di động. 3. Java Platform, Standard Edition (Java SE) là nền tảng tiêu chuẩn, dành cho môi trường máy trạm, thường được dùng để phát triển Java application và Java applet. Đây là nền tảng được sử dụng rộng rãi, dùng để triển khai các ứng dụng nhẹ cho mục đích sử dụng tổng quát. Java SE bao gồm một máy ảo Java và một bộ các thư viện cần thiết cho việc sử dụng hệ thống file, mạng, giao diện đồ họa, v.v.. trong chương trình. 4. Java Platform, Enterprise Edition (Java EE) dành cho môi trường lớn và phân tán của doanh nghiệp hoặc Internet, thường dùng để phát triển các server. Nền tảng này khác với Java SE ở chỗ nó có thêm các thư viện với chức năng triển khai các phần mềm phân tán đa tầng có khả năng chịu lỗi. Cuốn sách này sẽ chỉ dùng Java làm ngôn ngữ minh họa cho lập trình hướng đối tượng, nên chỉ giới hạn trong phạm vi Java SE và Java application. 2.1.3. Môi trường lập trình Java Một môi trường lập trình Java thường bao gồm một số chương trình thực hiện các nhiệm vụ khác nhau để phục vụ công việc soạn, dịch, và chạy một chương trình Java. Có thể sử dụng một chương trình soạn thảo văn bản dạng text bất kì để viết mã nguồn Java. Một chương trình Java bao gồm một hoặc nhiều định nghĩa lớp. Theo quy ước, mỗi định nghĩa lớp được đặt trong một file riêng. Theo quy tắc một file mã nguồn Java chỉ được chứa nhiều nhất một định nghĩa lớp với từ khóa public – ý nghĩa của từ khóa này sẽ được nói đến sau. File chứa định nghĩa lớp phải có tên trùng với tên của lớp public đặt trong file đó, ví dụ file HelloWorld.java chứa lớp public có tên HelloWorld, file HelloWorldApplet.java chứa lớp public có tên HelloWorldApplet. Java là ngôn ngữ phân biệt chữ hoa chữ thường. Do đó nếu lớp HelloWorld được đặt trong file helloworld.java thì sẽ gây lỗi khi biên dịch. 23 Những người mới bắt đầu sử dụng Java nên bắt đầu từ việc viết chương trình bằng một phần mềm soạn thảo đơn giản và sử dụng các công cụ dòng lệnh trong bộ JDK để dịch và chạy chương trình. Ngay cả những lập trình viên thành thạo đôi khi cũng sử dụng cách này. Các bước cơ bản để xây dựng và thực thi một chương trình Java: Soạn thảo: Mã nguồn chương trình được viết bằng một phần mềm soạn thảo văn bản dạng text và lưu trên ổ đĩa. Ta có thể dùng những phần mềm soạn thảo văn bản đơn giản nhất như Notepad (trong môi trường Windows) hay emacs (trong môi trường Unix/Linux), hoặc các công cụ soạn thảo trong môi trường tích hợp để viết mã nguồn chương trình. Mã nguồn Java đặt trong các file với tên có phần mở rộng là.java. Dịch: Trình biên dịch Java (javac) lấy file mã nguồn và dịch thành các lệnh bằng bytecode mà máy ảo Java hiểu được, kết quả là các file có đuôi.class. Nạp và chạy: Trình nạp Java (java) sẽ dùng máy ảo Java để chạy chương trình đã được dịch ra dạng bytecode. Để thuận tiện và tăng năng suất cho việc lập trình, người ta dùng các môi trường lập trình tích hợp (IDE – integrated development environment). Trong đó, các bước dịch và chạy thường được kết hợp và thực hiện tự động, tất cả các công đoạn đối với người dùng chỉ còn là việc chạy các tính năng trong một phần mềm duy nhất. Trong số các IDE phổ biến nhất cho Java có Eclipse, NetBean và JBuilder. Tuy IDE rất hữu ích cho các lập trình viên, những người mới làm quen với ngôn ngữ nên tự thực hiện các bước dịch và chạy chương trình thay vì thông qua các chức năng của IDE. Như vậy, người học mới có thể nắm được bản chất các bước của quá trình xây dựng chương trình, hiểu được bản chất và đặc điểm chung của các IDE, tránh tình trạng bị phụ thuộc vào một IDE cụ thể. Do đó, cuốn sách này không hướng dẫn về một IDE nào mà chỉ dùng công cụ chạy từ dòng lệnh trong bộ JDK. 2.1.4. Cấu trúc mã nguồn Java Mỗi file mã nguồn (tên file có đuôi.java) chứa một định nghĩa lớp (class). Mỗi lớp đại diện cho một mảnh của chương trình, một chương trình nhỏ có thể chỉ bao gồm một lớp. Định nghĩa lớp phải được bọc trong một cặp ngoặc { }. Mỗi lớp có một vài phương thức. Trong lớp Car, phương thức break chứa các lệnh mô tả chiếc xe con cần phanh như thế nào. Các phương thức của lớp nào phải được khai báo ở bên trong định nghĩa lớp đó. Bên trong cặp ngoặc { } của một phương thức, ta viết một chuỗi các lệnh quy định hoạt động của phương thức đó. Có thể tạm coi phương thức của Java gần giống như hàm hay chương trình con. 24 Hình 2.2: Cấu trúc mã Java. 2.1.5. Chương trình Java đầu tiên Chương trình đơn giản trong Hình 2.3 sẽ hiện ra màn hình dòng chữ “Hello, world!”. Trong chương trình có những chi tiết mà tại thời điểm này ta chưa cần hiểu rõ và có thể để đến vài chương sau. Ta sẽ xem xét từng dòng. Hình 2.3: Chương trình Java đầu tiên. Hai dòng đầu tiên bắt đầu bằng chuỗi // là các dòng chú thích chương trình. Đó là kiểu chú thích dòng đơn. Các dòng chú thích không gây ra hoạt động gì của chương trình khi chạy, trình biên dịch bỏ qua các dòng này. Ngoài ra còn có dạng chú thích kéo dài trên nhiều dòng, sử dụng để đánh dấu điểm bắt đầu và điểm kết thúc đoạn chú thích. Dòng thứ ba, public class HelloWorld { tuyên bố rằng đây là định nghĩa về một lớp có tên HelloWorld. "HelloWorld" là tên của lớp và cũng là tên của chương trình, tuy rằng không phải lớp nào cũng là một chương trình như trong ví dụ này. Để một lớp là một chương trình, ta cần viết cho lớp đó một phương thức có tên main với định nghĩa có dạng sau. Đây là cú pháp bắt buộc của phương thức main(): 25 Khi ta yêu cầu trình thông dịch Java chạy chương trình HelloWorld, máy ảo Java sẽ tìm lớp có tên HelloWorld, rồi nó tìm phương thức main() với cú pháp bắt buộc như trên. Đây là nơi chương trình bắt đầu thực hiện và kết thúc, máy ảo lần lượt chạy các lệnh ở bên trong cặp ngoặc { } của phương thức main(). Phương thức main() có thể gọi các phương thức khác được định nghĩa trong lớp hiện tại hoặc trong các lớp khác, nó quyết định chuỗi công việc mà máy tính sẽ thực hiện khi chương trình chạy. Mỗi ứng dụng Java phải có ít nhất một lớp, và có một phương thức main() trong một lớp nào đó. Từ khóa public tại dòng đầu tiên của main() có nghĩa rằng đây là phương thức có mức truy nhập public (công khai) – phương thức có thể được gọi từ bất cứ đâu trong mã chương trình. Thực tế là main() được gọi từ trình thông dịch – một thứ nằm ngoài chương trình. Từ khóa static sẽ được giải thích trong các chương sau. Từ khóa void có nghĩa rằng phương thức main() không có kết quả trả về. Tham số String[] args của hàm main() là mảng chứa các xâu kí tự được nhập vào dưới hình thức tham số dòng lệnh khi ta chạy chương trình từ cửa sổ lệnh (console). Thân phương thức main(), cũng như bất kì một hàm nào khác, được bắt đầu và kết thúc bởi cặp ngoặc { }, bên trong đó là chuỗi các lệnh mà khi chương trình chạy chúng sẽ được thực hiện tuần tự từ lệnh đầu tiên cho đến lệnh cuối cùng. Mỗi lệnh Java đều kết thúc bằng một dấu chẩm phảy. Phương thức main() trong ví dụ đang xét có chứa đúng một lệnh. Lệnh này có tác dụng hiển thị thông điệp ra đầu ra chuẩn (standard output). Đó là ví dụ về một lệnh gọi hàm. Lệnh này gọi hàm System.out.println(), một hàm có sẵn trong thư viện chuẩn Java, yêu cầu hàm này thực hiện việc hiển thị thông điệp. Nói theo cách của lập trình hướng đối tượng, lệnh đó chính là một thông điệp gửi tới đối tượng có tên System.out yêu cầu in ra đầu ra chuẩn một xâu kí tự. Khi chạy chương trình, thông điệp "Hello, world!" (không có nháy kép) sẽ được hiển thị ra đầu ra chuẩn. Đầu ra chuẩn là cái gì thì tùy vào việc chương trình đang chạy ở loại thiết bị nào, platform nào. Lưu ý rằng trong Java, một hàm không thể tồn tại độc lập. Nó phải thuộc về một lớp nào đó. Một chương trình được định nghĩa bởi một lớp public có dạng Trong đó, là tên lớp, tên chương trình, và cũng là tên file mã nguồn. public là từ khóa cần được đặt đầu khai báo các lớp chương trình. Những 26 lớp được khai báo với từ khóa này cần được đặt tại một file có tên file trùng với tên lớp, chính xác đến cả chữ hoa hay chữ thường. Ví dụ, lớp HelloWorld ở trên nằm trong file mã nguồn có tên HelloWorld.java. Sau khi biên dịch file mã nguồn HelloWorld.java, ta sẽ được file bytecode HelloWorld.class – file có thể chạy bằng trình thông dịch Java. Phụ lục A hướng dẫn chi tiết về cách sử dụng công cụ dòng lệnh JDK để dịch và chạy chương trình. Đây là bộ phần mềm miễn phí, có thể được tải về từ trang web của Oracle3. 2.2. BIẾN Trong một chương trình, biến là tên của một vùng bộ nhớ được dùng để lưu dữ liệu trong khi chương trình chạy. Dữ liệu lưu trong một biến được gọi là giá trị của biến đó. Chúng ta có thể truy nhập, gán hay thay đổi giá trị của các biến, khi biến được gán một giá trị mới, giá trị cũ sẽ bị ghi đè lên. Java yêu cầu mỗi biến trước khi dùng phải được khai báo. Ví dụ: Các biến được khai báo ở trong một hàm là biến địa phương. Nên khai báo biến địa phương ngay trước khi sử dụng hoặc ở đầu khối mã chương trình được đóng khung trong cặp ngoặc { }. Biến địa phương được khai báo tại hàm nào thì có hiệu lực ở bên trong hàm đó, chẳng hạn numberOfBaskets và applePerBasket trong Hình 2.4 là các biến địa phương của hàm main và chỉ có hiệu lực ở bên trong hàm main(). Ngoài biến địa phương, Java còn có loại biến thực thể với phạm vi nằm trong một đối tượng và biến lớp với phạm vi lớp. Ch-¬ng 4 và Ch-¬ng 10 sẽ mô tả chi tiết về hai loại biến này. 3 Địa chỉ http://www.oracle.com/technetwork/java/javase/downloads/index.html 27 Hình 2.4: Sử dụng biến địa phương. Một biến địa phương đã được khai báo nhưng chưa được gán một giá trị nào được gọi là biến chưa được khởi tạo và nó có giá trị không xác định. Trình biên dịch sẽ báo lỗi đối với mã sử dụng biến địa phương chưa được khởi tạo. Có thể khởi tạo giá trị của biến ngay tại lệnh khai báo để tránh tình huống quên khởi tạo biến, ví dụ: char grade = 'A'; Vùng hiệu lực của một biến có thể còn nhỏ hơn phạm vi phương thức. Trong các phương thức, ta thường tạo các khối lệnh. Thông thường, các khối được giới hạn bởi cặp ngoặc { }. Ví dụ về một số khối thường gặp là các lệnh có cấu trúc (for, while) và các lệnh điều kiện (if) được trình bày chi tiết tại Mục 2.4. Nếu một biến được khai báo bên trong một khối lệnh thì nó chỉ có phạm vi cho đến hết khối lệnh đó. 2.3. CÁC PHÉP TOÁN CƠ BẢN 2.3.1. Phép gán Phép gán là cách gắn một giá trị cho một biến hoặc thay đổi giá trị của một biến. Lệnh gán trong Java có công thức: biến = biểu thức; Trong đó, dấu bằng (=) được gọi là dấu gán hay toán tử gán, biểu thức ở vế phải dấu gán được tính rồi lấy kết quả gán cho biến nằm ở vế trái. Biểu thức tại vế phải có thể là một giá trị trực tiếp, một biến, hoặc một biểu thức phức tạp. 2.3.2. Các phép toán số học Java hỗ trợ năm phép toán số học sau: + (cộng), - (trừ), * (nhân), / (chia), % (modulo – lấy phần dư của phép chia). Các phép toán này chỉ áp dụng được cho các biến kiểu cơ bản như int, long và không áp dụng được cho các kiểu tham chiếu. Phép chia được thực hiện cho hai giá trị kiểu nguyên sẽ cho kết quả là thương nguyên. Ví dụ biểu thức 4 / 3 cho kết quả bằng 1, còn 3 / 5 cho kết quả bằng 0. 28 Một số phép gán kèm theo biểu thức xuất hiện nhiều lần trong một chương trình, vì vậy Java cho phép viết các phép gán biểu thức đó một cách ngắn ngọn hơn, sử dụng các phép gán phức hợp (+=, -=, *=, /=, %=, >>=, > x > y x lớn hơn y < < x < y x nhỏ hơn y ≥ >= x >= y x lớn hơn hoặc bằng y ≤ = 9.0) System.out.print("Excellent!"); Ta có thể dùng các cấu trúc if-else lồng nhau để tạo ra điều kiện rẽ nhánh phức tạp. Lấy một ví dụ phức tạp hơn: cho trước điểm số (lưu tại biến score kiểu double), xác định xếp loại học lực A, B, C, D, F tùy theo điểm đó. Quy tắc xếp loại là: nếu điểm từ 8.5 trở lên thì đạt loại A, điểm từ 7.0 tới dưới 8.5 đạt loại B, v.v.. Tại đoạn mã xét các trường hợp của xếp loại điểm, ta có thể dùng cấu trúc if-else lồng nhau như sau: if (score >= 8.5) grade = 'A'; else if (score >= 7.0) grade = 'B'; else if (score >= 5.5) grade = 'C'; else if (score >= 4.0) grade = 'D'; else grade = 'F'; Một điều cần đặc biệt lưu ý là nếu muốn thực hiện nhiều hơn một lệnh trong mỗi trường hợp của lệnh if-else, ta cần dùng cặp ngoặc { } bọc tập lệnh đó thành một khối lệnh. Ví dụ, phiên bản phức tạp hơn của lệnh if trong Hình 2.5: 32 Lệnh switch Khi chúng ta muốn viết một cấu trúc rẽ nhánh có nhiều lựa chọn, ta có thể sử dụng nhiều lệnh if-else lồng nhau. Tuy nhiên, trong trường hợp việc lựa chọn rẽ nhánh phụ thuộc vào giá trị (kiểu số nguyên hoặc kí tự, hoặc xâu kí tự kể từ JDK 7.0) của một biến hay biểu thức, ta có thể sử dụng cấu trúc switch để chương trình dễ hiểu hơn. Lệnh switch điển hình có dạng như sau: switch (biểu_thức) { case hằng_1: tập_lệnh_1; break; case hằng_2: tập_lệnh_2; break;... default: tập_lệnh_mặc_định; } Khi lệnh switch được chạy, biểu_thức được tính giá trị và so sánh với hằng_1. Nếu bằng nhau, chuỗi lệnh kể từ tập_lệnh_1 được thực thi cho đến khi gặp lệnh break đầu tiên, đến đây chương trình sẽ nhảy tới điểm kết thúc cấu trúc switch. Nếu biểu_thức không có giá trị bằng hằng_1, nó sẽ được so sánh với hằng_2, nếu bằng nhau, chương trình sẽ thực thi chuỗi lệnh kể từ tập_lệnh_2 tới khi gặp lệnh break đầu tiên thì nhảy tới cuối cấu trúc switch. Quy trình cứ tiếp diễn như vậy. Cuối cùng, nếu biểu_thức có giá trị khác với tất cả các giá trị đã được liệt kê (hằng_1, hằng_2,...), chương trình sẽ thực thi tập_lệnh_mặc_định nằm sau nhãn default: nếu như có nhãn này (không bắt buộc). Ví dụ, lệnh sau so sánh giá trị của biến grade với các hằng kí tự 'A', 'B', 'C' và in ra các thông báo khác nhau cho từng trường hợp. 33 switch (grade) { case 'A': System.out.print("Grade = A"); break; case 'B': System.out.print("Grade = B"); break; case 'C': System.out.print("Grade = C"); break; default: System.out.print("Grade's not A, B or C"); } Nó tương đương với khối lệnh if-else lồng nhau sau: Lưu ý, các nhãn case trong cấu trúc switch phải là hằng chứ không thể là biến hay biểu thức. Nếu cần so sánh với biến hay biểu thức, ta nên dùng khối lệnh if-else lồng nhau. Vấn đề đặc biệt của cấu trúc switch là các lệnh break. Nếu ta không tự gắn một lệnh break vào cuối chuỗi lệnh cần thực hiện cho mỗi trường hợp, chương trình sẽ chạy tiếp chuỗi lệnh của trường hợp sau chứ không tự động nhảy tới cuối cấu trúc switch. Ví dụ, đoạn chương trình sau sẽ chạy lệnh in thứ nhất nếu grade nhận một trong ba giá trị 'A', 'B', 'C' và chạy lệnh in thứ hai trong trường hợp còn lại: switch (grade) { case 'A': case 'B': case 'C': cout