
Node.js là một môi trường chạy mã JavaScript trên máy chủ (server-side) rất mạnh mẽ, nhưng có lúc bạn cần thực hiện nhiều nhiệm vụ song song hoặc tương tác với các tiến trình ngoại vi, và đó là lúc Child Process (Tiến trình con) trong Node.js xuất hiện.
Child process là gì?
Child process là một module của Node.js cho phép tạo ra các tiến trình con (process) độc lập để thực hiện các tác vụ cụ thể. Nó cho phép Node.js chạy nhiều tác vụ đồng thời và tận dụng tối đa sức mạnh của máy chủ. Khi tạo ra một child process, nó sẽ chạy độc lập với parent process (tiến trình cha) và có thể giao tiếp với cha qua luồng (stream), các sự kiện (event)… Các child process được tạo ra có tài nguyên độc lập, giúp giảm thiểu tác động đến các tiến trình khác khi xử lý tác vụ nặng hoặc chẳng may bị lỗi.
Vấn đề
Có một lời khuyên mà chắc hẳn ai làm việc với Node.js đều phải thuộc lòng đó là “đừng bao giờ chặn vòng lặp sự kiện”. Chặn ở đây có nghĩa là không để cho Event Loop được thực thi chức năng vốn có của nó. Node.js chỉ có một luồng để xử lý mã JavaScript, nếu một công việc chiếm tương đối thời gian để xử lý thì nó sẽ gây ra một cuộc tắc nghẽn nghiêm trọng trong luồng chính. Hay nói cách khác, tất cả cuộc gọi API có thể sẽ không bao giờ được phản hồi cho đến khi công việc đó xong.
Biết được vấn đề, tất nhiên Node.js phải cung cấp cho chúng ta một số cách để giải quyết. Thay vì gọi những hàm đồng bộ thì hãy chuyển qua gọi hàm bất đồng bộ, ví dụ như cùng là đọc file nhưng readFile
sẽ được khuyên dùng hơn readFileSync
bởi vì readFile
là hàm bất đồng bộ. Ngoài ra, nếu công việc đòi hỏi khả năng tính toán cao của CPU như xử lý hình ảnh, video… thì có một giải pháp khác là sử dụng module child_process
được tích hợp trong Node.
Có thể nói child_process
là giải pháp sớm nhất mà Node.js đưa ra, sau này chúng ta có thêm module worker_threads
cũng có khả năng giải quyết được vấn đề chặn vòng lặp sự kiện. Tôi đã có một bài về Worker threads là gì? Bạn đã biết khi nào thì sử dụng Worker threads trong node.js chưa?, bạn đọc có thể tham khảo thêm về khái niệm cũng như cách dùng nó. Nhưng trong phạm vi bài viết này, chúng ta hãy tạm quên đi Worker threads và tập trung vào xem Child process là gì và nó được sử dụng như thế nào nhé.
Cho dễ hình dung, một ứng dụng Node.js khi khởi động thì nó là một process với một bộ V8 Engine được tạo ra. Để ngăn vòng lặp sự kiện bị chặn, cách tốt nhất là tạo ra một tiến trình khác để xử lý. Khi đó, nó có thể chạy độc lập với tiến trình cha, xử lý rồi trả lại kết quả cho tiến trình cha thông qua một kênh giao tiếp như đã kể đến ở bên trên.
Tùy thuộc vào cách child process được tạo ra mà nó có cách thực hiện nhiệm vụ khác nhau. Có hai cách phổ biến để tạo ra child process là spawn
và fork
. Trong khi fork
cố gắng tạo ra một "bản sao" của process cha, có nghĩa là "clone" ra một V8 Engine để xử lý tác vụ thì spawn
lại chỉ đơn giản là tạo ra một process thực hiện câu lệnh nào đó. Chi tiết hơn, chúng ta hãy đi qua từng phương thức xem chúng thực chất là như thế nào.
spawn
spawn
là một phương thức để tạo ra một child process mới. Khi sử dụng spawn
, ta có thể truyền cho child process các tham số, tùy chọn và đối số cần thiết để thực thi lệnh hoặc file thực thi
fork
fork
cũng là một phương thức để tạo ra một child process mới, nó là một trường hợp đặc biệt của spawn
, hay nói cách khác fork
chỉ là một hàm dựa trên spawn
. Child process này sẽ chạy một phiên bản độc lập của mã JavaScript được chỉ định. Mã này có thể được đặt trong một file hoặc một function được truyền dưới dạng tham số cho hàm fork
.
Khi nào nên sử dụng child process cũng như fork hoặc spawn?
Trước tiên, phải nói rằng lựa chọn sử dụng child process còn phụ thuộc vào bài toán đang cần giải quyết. Vì chi phí để tạo ra một process là khá tốn kém cho nên không phải cứ tạo ra càng nhiều child process thì ứng dụng của bạn sẽ xử lý càng nhanh. Ngược lại, nó có thể nhanh chóng làm cạn kiệt tài nguyên máy chủ cũng như chi phí liên lạc giữa các tiến trình với nhau.
Node.js xử lý rất tốt I/O không đồng bộ, nếu ứng dụng xử lý nhiều về I/O có thể cần phải quan tâm đến cấu hình sao cho Worker Pools trong libuv được tối ưu nhất chứ không phải là tạo ra nhiều child process để xử lý I/O không đồng bộ. Bạn đọc có thể tham khảo thêm bài viết Phân biệt tác vụ I/O và tác vụ chuyên sâu CPU để biết cách phân biệt tác vụ I/O với Tác vụ chuyên sâu CPU.
Trong trường hợp ứng dụng cần sự tính toán của CPU nhiều hơn thì child process thực sự phù hợp. Lúc này cần phải vận dụng kinh nghiệm sử dụng hai cách tạo ra tiến trình con đã nêu ra ở trên để tối ưu chi phí tài nguyên.
Ví dụ bạn có cài một phần mềm, lệnh, bash script… trong máy chủ và muốn gọi chúng từ Node.js thì hãy sử dụng spawn
. Nó chỉ đơn giản tạo ra một tiến trình để thực hiện câu lệnh trong spawn
rồi trả về kết quả, vừa nhanh vừa tiết kiệm.
fork
thì lại phù hợp trong trường hợp công việc "High CPU" nằm trong một file hoặc một hàm JavaScript. fork
tạo ra một bản sao V8 Engine và có toàn quyền truy cập vào những module (node_modules) có trong ứng dụng của bạn. Hơn nữa, vì là tiến trình độc lập nên chẳng may tiến trình bị lỗi thì không gây ảnh hưởng nghiêm trọng đến ứng dụng của bạn cả.
Nói công việc nặng thì có vẻ trừu tượng, hãy lấy một ví dụ cụ thể là xử lý hình ảnh - đó là một trong những công việc đòi hỏi khả năng tính toán của CPU như resize, filter, cân bằng sáng tối… Bạn có thể tìm được rất nhiều ứng dụng dạng command line (cli) để cài vào máy, hoặc tìm kiếm các thư viện xử lý hình ảnh của Node.js. Nếu dùng cli tiện hơn, hãy dùng spawn
, còn sử dụng thư viện, hãy dùng fork

Devwork là Nền tảng TUYỂN DỤNG IT CẤP TỐC với mô hình kết nối Nhà tuyển dụng với mạng lưới hơn 30.000 headhunter tuyển dụng ở khắp mọi nơi.Với hơn 1800 doanh nghiệp IT tin dùng Devwork để :
Tag Cloud:
Tác giả: quyenntt
Bài viết liên quan

Sniffer là gì? Top 5 công cụ Packet Sniffer mạnh nhất
Với sự phát triển nhanh chóng của công nghệ thông tin, vấn đề bảo mật mạng ngày càng trở nên quan trọng. Một trong những công cụ cần được hiểu rõ trong lĩnh vực này là sniffer. Bài viết dưới đây sẽ giúp bạn hiểu rõ sniffer là gì và tầm quan trọng của nó trong bảo mật mạng hiện đại....
Socket.IO là gì? Phân biệt Socket.IO & WebSocket?
Nếu bạn đang muốn xây dựng một ứng dụng chat thời gian thực hay hệ thống thông báo linh hoạt, Socket.IO chính là công cụ không thể bỏ qua. Bài viết này sẽ giúp bạn hiểu rõ Socket.IO là gì, cách nó hoạt động, ưu điểm nổi bật, và hướng dẫn chi tiết cách cài đặt & sử dụng dễ hiểu.

Source code là gì? Khái niệm, vai trò & ví dụ minh họa
Source code là gì và vai trò của nó luôn là câu hỏi cơ bản nhưng vô cùng quan trọng cho những ai đang học tập và làm việc trong lĩnh vực phát triển phần mềm. DevWork xin giới thiệu đến bạn đọc bài viết tổng quan chi tiết về source code - nền tảng thiết yếu của mọi phần mềm và ứng dụng hiện nay

Tensor là gì? Hướng dẫn A-Z cho người mới học lập trình AI
Nếu bạn đang bước vào thế giới trí tuệ nhân tạo và học sâu, chắc chắn bạn sẽ nghe đến "tensor" như một từ khóa quen thuộc. Nhưng tensor là gì, tại sao nó quan trọng đến vậy trong lập trình AI? Bài viết này sẽ giúp bạn hiểu rõ khái niệm, cách tạo và thao tác với tensor thông qua các ví dụ cụ thể với TensorFlow, PyTorch và NumPy.


IT Support là gì? Tổng quan công việc, kỹ năng & cơ hội thăng tiến
Bạn đang gặp sự cố với máy tính? Hệ thống CNTT của công ty không hoạt động ổn định? Đây là lúc bạn cần đến sự hỗ trợ của IT Support. Vậy IT Support là gì? Trong bài viết này, bạn đọc hãy cùng Devwork khám phá chi tiết về những "hiệp sĩ công nghệ" âm thầm đảm bảo mọi hoạt động kỹ thuật số luôn trơn tru.

Mã hoá RSA là gì? Giải mã nguyên lý hoạt động chi tiết
Từ việc đăng nhập tài khoản ngân hàng đến gửi email bảo mật, RSA chính là thuật toán phổ biến trong thế giới số. Nhưng bạn có thực sự hiểu RSA là gì, hoạt động ra sao và vì sao nó lại trở thành nền tảng trong lĩnh vực an toàn thông tin? Bài viết này sẽ giúp bạn giải đáp.
