Bạn đã biết về lỗ hổng Class Pollution trong Python hay chưa (P1)?
Chúc mọi người một năm mới đạt được tất cả dự định của mình, gia đình vui vẻ, hạnh phúc. Chúc mừng năm mới !!!
Mở đầu
Prototype Pollution là một trong những lỗ hổng dành riêng cho ngôn ngữ lập trình nhất định vì nó chỉ ảnh hưởng đến các ngôn ngữ lập trình dựa trên Prototype. Để hiểu rõ hơn thì theo Prototype-based programming - MDN Web Docs Glossary: Definitions of Web-related terms | MDN (mozilla.org) lập trình dựa trên Prototype là một phong cách lập trình hướng đối tượng trong đó các lớp không được xác định rõ ràng, mà được dẫn xuất bằng cách thêm các thuộc tính và phương thức vào một đối tượng trống. Nói một cách đơn giản: loại phong cách này cho phép tạo một đối tượng mà không cần xác định lớp của nó trước.
Mặc dù JavaScript không phải là ngôn ngữ lập trình duy nhất dựa trên Prototype, nhưng JavaScript là một trong những ngôn ngữ lập trình phổ biến nhất trong số đó, do đó bạn sẽ thấy rằng tất cả các tài liệu đều nói về Prototype Pollution trong JavaScript. Có thể có Prototype Pollution trong các ngôn ngữ dựa trên Prototype khác, tuy nhiên, chúng ta không thể nói rằng một ngôn ngữ lập trình dễ bị tổn thương chỉ vì nó sử dụng Prototype.
Dig Deeper into Prototype Pollution in Python
Hãy bắt đầu bằng cách giải thích Prototype nghĩa là gì và tại sao nó được sử dụng. JavaScript sử dụng mô hình kế thừa dựa trên Prototype, mặc dù cái tên nghe có vẻ lạ, nhưng ý tưởng này tương tự như kế thừa dựa trên lớp thông thường với một số khác biệt.
Theo https://developer.mozilla.org/en-US/docs/Learn/JavaScript/Objects/Object_prototypes Prototype là cơ chế mà các đối tượng JavaScript kế thừa các tính năng từ nhau. Mọi đối tượng đều có bộ thuộc tính tích hợp sẵn gọi là prototype. Bản thân prototype cũng là một đối tượng. Vì vậy nên prototype cũng sẽ có prototpye của riêng nó tạo nên chuỗi prototype. Chuỗi prototype sẽ kết thúc khi mà prototype của nó là null.
Khi bạn cố gắng truy cập một thuộc tính của một đối tượng: nếu không thể tìm thấy thuộc tính trong chính đối tượng đó, prototype sẽ được tìm kiếm để tìm thuộc tính đó. Nếu vẫn không thể tìm thấy thuộc tính, thì prototype của prototype sẽ được tìm kiếm, v.v. cho đến khi tìm thấy thuộc tính hoặc đến cuối chuỗi, trong trường hợp đó, undefined được trả về.
Ví dụ trong JavaScript, khi chúng ta gọi myObject.toString()
thì browser sẽ thực hiện tìm kiếm như sau:
- Tìm kiếm method
toString()
trong đối tượngmyObject
- Nếu không tìm thấy, tiếp tục tìm kiếm trong đối tượng Prototype của
myObject
. - Nếu tìm thấy sẽ gọi nó lên, ngược lại trả lại undefined.
Sau khi chúng ta biết Prototype là gì, hãy tìm hiểu thêm một chút về Prototype Pollution. Có rất nhiều tài liệu tuyệt vời giải thích sâu hơn về Protopye Pollution trong JavaScript, tôi khuyên bạn nên kiểm tra chúng trước khi tiếp tục đọc.
Prototype Pollution là một lỗ hổng trong đó kẻ tấn công có thể sửa đổi Object.prototype
. Bởi vì gần như tất cả các đối tượng trong JavaScript đều là thể hiện của Object, nên một đối tượng điển hình kế thừa các thuộc tính (bao gồm cả các phương thức) từ Object.prototype. Việc thay đổi Object.prototype có thể dẫn đến nhiều vấn đề, thậm chí đôi khi dẫn đến việc thực thi mã từ xa.
Tính linh hoạt được cung cấp bởi một số ngôn ngữ kịch bản chẳng hạn như Python làm cho sự khác biệt giữa các mô hình kế thừa dựa trên prototype và dựa trên lớp không được chú ý trong thực tế. Do đó, chúng ta có thể sao chép ý tưởng về Protopye Pollution trong các ngôn ngữ lập trình khác, ngay cả những ngôn ngữ sử dụng kế thừa dựa trên lớp.
Chúng ta sẽ gọi lỗ hổng này là Class Pollution trong bài viết này vì chúng ta thực sự không có Prototype trong Python.
Các magic method là các method đặc biệt được gọi ngầm bởi tất cả các đối tượng trong Python trong các hoạt động khác nhau, chẳng hạn như __str__()
, __eq__()
và __call__()
.
Chúng được sử dụng để xác định những gì các đối tượng của một lớp nên làm khi được sử dụng trong các câu lệnh khác nhau và với các toán tử khác nhau. Chúng ta có thể ghi đè các magic method và cung cấp triển khai của riêng ta khi định nghĩa các lớp mới.
Trong Python, chúng ta không có Prototype nhưng chúng ta có các thuộc tính đặc biệt, chẳng hạn như __class__
, __doc__
, v.v., mỗi thuộc tính này được sử dụng cho một mục đích cụ thể.
Trong đoạn mã sau, chúng ta đã tạo một thể hiện của lớp Employee, là một lớp trống, sau đó định nghĩa một thuộc tính và phương thức mới cho đối tượng đó. Các thuộc tính và phương thức có thể được định nghĩa trên một đối tượng cụ thể để chỉ đối tượng đó có thể truy cập được (none-static) hoặc được định nghĩa trên một lớp để tất cả các đối tượng của lớp đó có thể truy cập nó (static).
class Employee: pass # tạo mới class
emp = Employee()
another_emp = Employee()
Employee.name = 'No one' # định nghĩa thuộc tính cho class Employee
print(emp.name)
emp.name = 'Employee 1' # định nghĩa thuộc tính cho đối tượng (ghi đè lại thuộc tính của class)
print(emp.name)
emp.say_hi = lambda: 'Hi there!' # định nghĩa method cho đối tượng
print(emp.say_hi())
Employee.say_bye = lambda s: 'Bye!' # Định nghĩa method cho Employee class
print(emp.say_bye())
Employee.say_bye = lambda s: 'Bye bye!' # ghi đè method cho Employee class
print(another_emp.say_bye())
#> No one
#> Employee 1
#> Hi there!
#> Bye!
#> Bye bye!
Từ quan điểm của kẻ tấn công, chúng ta quan tâm nhiều hơn đến các thuộc tính mà chúng ta có thể ghi đè để có thể khai thác lỗ hổng này hơn là các magic method. Vì đầu vào của chúng tôi sẽ luôn được coi là dữ liệu (str, int, v.v.). Do đó, nếu chúng ta cố ghi đè bất kỳ magic method nào, điều đó sẽ dẫn đến việc ứng dụng bị treo khi cố gọi phương thức đó, vì dữ liệu như string không thể được thực thi. Ví dụ: cố gắng gọi phương thức __str__()
sau khi đặt giá trị của nó thành một chuỗi sẽ gây ra lỗi như TypeError: 'str' object is not callable.
Bây giờ, hãy thử ghi đè lên một trong những thuộc tính quan trọng nhất của bất kỳ đối tượng nào trong Python, đó là __class__
, thuộc tính trỏ đến lớp mà đối tượng là một thể hiện của nó. Trong ví dụ của chúng tôi, emp.__class__
trỏ đến lớp Employee
vì nó là một thể hiện của lớp đó. Bạn có thể coi <instance>.__class__
trong Python là<instance>.constructor
trong JavaScript.
Vì vậy, hãy thử đặt thuộc tính __class__
của đối tượng emp
thành một chuỗi chẳng hạn và xem điều gì sẽ xảy ra.
class Employee: pass # Creating an empty class
emp = Employee()
emp.__class__ = 'Polluted'
#> Traceback (most recent call last):
#> File "<stdin>", line 1, in <module>
#> TypeError: __class__ must be set to a class, not 'str' object
Mặc dù chúng ta đã gặp lỗi, nhưng lỗi này có vẻ đầy hứa hẹn! Nó cho thấy rằng __class__
phải được đặt thành một lớp khác chứ không phải một chuỗi. Điều này có nghĩa là nó đang cố ghi đè thuộc tính đặc biệt đó bằng những gì chúng ta đã cung cấp, vấn đề duy nhất là kiểu dữ liệu của giá trị mà chúng ta đang cố gắng đặt __class__
thành.
Hãy thử thiết lập một thuộc tính khác chấp nhận chuỗi, thuộc tính __qualname__
bên trong __class__
có thể phù hợp để thử nghiệm. __class__.__qualname__
là một thuộc tính chứa tên lớp và được sử dụng trong triển khai mặc định phương thức __str__()
của lớp để hiển thị tên lớp.
class Employee: pass # Creating an empty class
emp = Employee()
emp.__class__.__qualname__ = 'Polluted'
print(emp)
print(Employee)
#> <__main__.Polluted object at 0x0000024765C48250>
#> <class '__main__.Polluted'>
Như được hiển thị ở trên, chúng ta có thể pollute lớp và đặt thuộc tính __qualname__
thành một chuỗi tùy ý. Hãy nhớ rằng khi chúng ta đặt __class__.__qualname__
trên một đối tượng của một lớp, thuộc tính __qualname__
của lớp đó (trong trường hợp của chúng ta là Employee) đã bị thay đổi, điều này là do __class__
trỏ đến lớp của đối tượng đó và bất kỳ sửa đổi nào trên nó thực sự sẽ được áp dụng cho lớp như chúng ta đã đề cập trước đây.
Để xem lỗ hổng bảo mật có thể tồn tại như thế nào trong các ứng dụng Python thực, chúng ta sẽ xem xét chức năng hợp nhất đệ quy.
Hàm hợp nhất đệ quy có thể tồn tại theo nhiều cách và cách triển khai khác nhau và có thể được sử dụng để hoàn thành các tác vụ khác nhau, chẳng hạn như hợp nhất hai hoặc nhiều đối tượng, sử dụng JSON để đặt thuộc tính của đối tượng, v.v. Hàm chúng ta cần quan tâm là một hàm nhận đầu vào mà chúng ta có thể kiểm soát và sử dụng nó để đặt các thuộc tính của một đối tượng theo cách đệ quy.
Tuy nhiên, việc tìm kiếm một hàm như vậy là đủ để khai thác lỗ hổng, tuy nhiên, nếu chúng ta may mắn tìm thấy một hàm hợp nhất không chỉ cho phép chúng ta duyệt đệ quy và đặt thuộc tính (__getattr__
và__setattr__
) của một đối tượng mà còn cho phép chúng ta duyệt đệ quy và thiết lập items (thông qua __getitem__
và __setitem__
), điều này giúp bạn dễ dàng tìm thấy các gadget tuyệt vời để tận dụng.
Mặt khác, một chức năng hợp nhất sử dụng đầu vào mà chúng ta kiểm soát để đặt đệ quy các item của dictionary thông qua __getitem__
và __setitem__
sẽ không thể khai thác được vì chúng ta sẽ không thể truy cập các thuộc tính đặc biệt như __class__
, __base__
, v.v.
Trong đoạn mã sau, chúng ta có một hàm hợp nhất lấy một thể hiện emp của lớp Employee trống và thông tin của nhân viên emp_info là một dictionary (tương tự như JSON) mà chúng ta có thể kiểm soát. Hàm hợp nhất sẽ đọc các key và value từ dictionary emp_info và đặt chúng trên đối tượng đã cho emp. Cuối cùng, những gì trước đây là một dối tượng rỗng sẽ có các thuộc tính và item mà chúng ta đã đưa ra trong dictionary.
class Employee: pass # tạo mới class rỗng
def merge(src, dst):
# Recursive merge function
for k, v in src.items(): # lấy ra key và value từ dictionary
# print(k,v)
if hasattr(dst, '__getitem__'): # nếu dst là một dictionary
if dst.get(k) and type(v) == dict: # nếu value của key là một dictionary thì thực hiện đệ quy
merge(v, dst.get(k))
else:
dst[k] = v #thêm value vào dictionary dst
elif hasattr(dst, k) and type(v) == dict: # nếu dst có thuộc tính tên là key
merge(v, getattr(dst, k)) # thực hiện đệ quy truyền value v vào thuộc tính k của dst
else:
setattr(dst, k, v) # thực hiện set value cho thuộc tính k của dst
emp_info = {
"name":"Ahemd",
"age": 23,
"manager":{
"name":"Sarah"
}
}
emp = Employee()
print(vars(emp))
merge(emp_info, emp)
print(vars(emp))
print(f'Name: {emp.name}, age: {emp.age}, manager name: {emp.manager.get("name")}')
#> {}
#> {'name': 'Ahemd', 'age': 23, 'manager': {'name': 'Sarah'}}
#> Name: Ahemd, age: 23, manager name: Sarah
Bây giờ, hãy thử pollute một số thuộc tính đặc biệt! Chúng ta sẽ cập nhật emp_info để thử đặt thuộc tính __qualname__
của lớp Employee thông qua emp.__class__.__qualname__
như chúng ta đã làm trước đây, nhưng lần này sử dụng chức năng hợp nhất.
class Employee: pass # Tạo mới class
def merge(src, dst):
# Recursive merge function
for k, v in src.items():
if hasattr(dst, '__getitem__'):
if dst.get(k) and type(v) == dict:
merge(v, dst.get(k))
else:
dst[k] = v
elif hasattr(dst, k) and type(v) == dict:
merge(v, getattr(dst, k))
else:
setattr(dst, k, v)
emp_info = {
"name":"Ahemd",
"age": 23,
"manager":{
"name":"Sarah"
},
"__class__":{
"__qualname__":"Polluted"
}
}
emp = Employee()
merge(emp_info, emp)
print(vars(emp))
print(emp)
print(emp.__class__.__qualname__)
print(Employee)
print(Employee.__qualname__)
#> {'name': 'Ahemd', 'age': 23, 'manager': {'name': 'Sarah'}}
#> <__main__.Polluted object at 0x000001F80B20F5D0>
#> Polluted
#> <class '__main__.Polluted'>
#> Polluted
Chúng ta có thể pollute lớp Employee mà một thể hiện của nó được chuyển đến hàm hợp nhất, nhưng nếu chúng ta cũng muốn pollute lớp cha thì sao? Đây là lúc __base__
phát huy tác dụng, __base__
là một thuộc tính khác của lớp trỏ đến lớp cha gần nhất mà nó kế thừa từ đó, vì vậy nếu có một chuỗi thừa kế, __base__
sẽ trỏ đến lớp cuối cùng mà chúng ta kế thừa.
Trong ví dụ hiển thị bên dưới, hr_emp.__class__
trỏ đến lớp HR, trong khi hr_emp.__class__.__base__
trỏ đến lớp cha của lớp HR là Employee mà chúng ta sẽ pollute.
class Employee: pass # Creating an empty class
class HR(Employee): pass # Class inherits from Employee class
def merge(src, dst):
# Recursive merge function
for k, v in src.items():
if hasattr(dst, '__getitem__'):
if dst.get(k) and type(v) == dict:
merge(v, dst.get(k))
else:
dst[k] = v
if hasattr(dst, k) and type(v) == dict:
merge(v, getattr(dst, k))
else:
setattr(dst, k, v)
emp_info = {
"__class__":{
"__base__":{
"__qualname__":"Polluted"
}
}
}
hr_emp = HR()
merge(emp_info, hr_emp)
print(HR)
print(Employee)
#> <class '__main__.HR'>
#> <class '__main__.Polluted'>
Cách tiếp cận tương tự có thể được thực hiện nếu chúng ta muốn pollute bất kỳ lớp cha nào (không phải là một trong những loại bất biến) trong chuỗi thừa kế, bằng cách xâu chuỗi __base__
với nhau, chẳng hạn như __base__.__base__, __base__.__base__.__base__
, v.v.
Bây giờ bạn có thể thắc mắc tại sao chúng ta không pollute lớp Object , đó là lớp cha của tất cả các lớp ở cuối chuỗi thừa kế và việc sửa đổi bất kỳ thuộc tính nào của nó sẽ được phản ánh trên tất cả các đối tượng khác.
Nếu chúng ta cố gắng thiết lập một thuộc tính của lớp Object, chẳng hạn như object.__qualname__ = 'Polluted'
chẳng hạn, chúng ta sẽ nhận được thông báo lỗi TypeError: cannot set 'qualname' attribute of immutable type 'object'.
Điều này là do một số hạn chế mà Python có, vì nó không cho phép chúng ta sửa đổi các lớp có kiểu bất biến, chẳng hạn như object, str, int, dict, v.v.
Với giới hạn này, để khai thác class pollution trong Python, chúng ta muốn tận dụng một gadget thì các thành phần phải ở trong cùng một lớp hoặc ít nhất là chia sẻ cùng một lớp cha (không phải lớp object) tại bất kỳ điểm nào trong chuỗi thừa kế.
Trong ví dụ sau, mặc dù việc hợp nhất không an toàn xảy ra trên một đối tượng của lớp Recruiter và gadget hoặc chức năng mà chúng ta quan tâm (hàm execute_command cho phép thực thi lệnh) nằm trong lớp SystemAdmin, chúng ta vẫn có thể kiểm soát nó bằng cách thiết lập thuộc tính custom_command trong lớp Employee .
Điều này có thể thực hiện được vì SystemAdmin và Recruiter kế thừa từ lớp Employee tại một số điểm. Bằng cách tận dụng sự hợp nhất không an toàn, chúng tôi có thể đặt thuộc tính custom_command của lớp Employee, để khi một đối tượng của lớp SystemAdmin tìm thuộc tính đó, nó sẽ được tìm thấy, vì nó được kế thừa từ lớp cha Employee.
Việc đối tượng của lớp Recruiter được tạo trước hay sau thao tác hợp nhất không quan trọng vì chúng ta đang pollute chính lớp đó, điều này cũng sẽ được phản ánh trên đối tượng hiện có và các đối tượng mới của lớp đó. Chỉ là gadget phải được gọi sau khi pollute lớp.
from os import popen
class Employee: pass # Creating an empty class
class HR(Employee): pass # Class inherits from Employee class
class Recruiter(HR): pass # Class inherits from HR class
class SystemAdmin(Employee): # Class inherits from Employee class
def execute_command(self):
command = self.custom_command if hasattr(self, 'custom_command') else 'echo Hello there'
return f'[!] Executing: "{command}", output: "{popen(command).read().strip()}"'
def merge(src, dst):
# Recursive merge function
for k, v in src.items():
if hasattr(dst, '__getitem__'):
if dst.get(k) and type(v) == dict:
merge(v, dst.get(k))
else:
dst[k] = v
elif hasattr(dst, k) and type(v) == dict:
merge(v, getattr(dst, k))
else:
setattr(dst, k, v)
emp_info = {
"__class__":{
"__base__":{
"__base__":{
"custom_command": "whoami"
}
}
}
}
recruiter_emp = Recruiter()
system_admin_emp = SystemAdmin()
print(system_admin_emp.execute_command())
merge(emp_info, recruiter_emp)
print(system_admin_emp.execute_command())
#>[!] Executing: "echo Hello there", output: "Hello there"
#>[!] Executing: "whoami", output: "xxx\le.ngoc.anh"
Cho đến bây giờ, chúng ta chỉ có thể pollute các thuộc tính của đối tượng được chuyển đến hàm hợp nhất và chỉ các lớp cha có thể thay đổi của nó, nhưng đây không phải là tất cả.
Dựa trên tài liệu Python __globals__
là “Tham chiếu đến từ điển chứa các biến toàn cục của hàm — không gian tên toàn cục của mô-đun trong đó hàm được xác định.” Nói cách khác, __globals__
là một đối tượng dictionary cho phép chúng ta truy cập các biến đã xác định, mô-đun đã nhập, v.v. Để truy cập các item của thuộc tính __globals__
, hàm hợp nhất phải sử dụng __getitem__
như đã đề cập trước đó.
Thuộc tính __globals__
có thể truy cập được từ bất kỳ phương thức xác định nào của đối tượng mà chúng ta kiểm soát, chẳng hạn như __init__
. Chúng ta không nhất thiết phải sử dụng __init__
cụ thể, chúng ta có thể sử dụng bất kỳ phương thức đã xác định nào của đối tượng đó để truy cập __globals__
, tuy nhiên, rất có thể chúng ta sẽ tìm thấy phương thức __init__
trên mọi lớp vì đây là hàm tạo của lớp. Chúng ta không thể sử dụng các phương thức dựng sẵn được kế thừa từ lớp đối tượng, chẳng hạn như __str__
trừ khi chúng bị ghi đè. Hãy nhớ rằng <instance>.__init__
, <instance>.__class__.__init__
và <class>.__init__
đều giống nhau và trỏ đến cùng một hàm tạo của lớp.
Vì vậy, quy tắc ở đây là nếu chúng ta có thể tìm thấy một chuỗi thuộc tính/items (dựa trên hàm hợp nhất) từ đối tượng mà chúng ta kiểm soát đến bất kỳ thuộc tính hoặc biến nào mà chúng ta muốn kiểm soát, thì chúng ta sẽ có thể để ghi đè lên nó.
Điều này giúp chúng ta linh hoạt hơn nhiều và tăng bề mặt tấn công theo cấp số nhân khi tìm kiếm các gadget để tận dụng. Chúng ta sẽ hiển thị một số ví dụ về gadget mà bạn có thể tận dụng.
Trong ví dụ sau, chúng ta sẽ tận dụng thuộc tính đặc biệt __globals__
để truy cập và thiết lập một thuộc tính của lớp NotAccessibleClass, đồng thời sửa đổi biến toàn cục not_accessible_variable. NotAccessibleClass và not_accessible_variable sẽ không thể truy cập được nếu không có __globals__
vì lớp này không phải là lớp cha của đối tượng mà chúng ta kiểm soát và biến không phải là thuộc tính của lớp mà chúng ta kiểm soát. Tuy nhiên, vì chúng ta có thể tìm thấy một chuỗi các thuộc tính/items để truy cập nó từ đối tượng mà chúng ta có, nên chúng ta có thể làm pollute NotAccessibleClass và not_accessible_variable.
def merge(src, dst):
# Recursive merge function
for k, v in src.items():
if hasattr(dst, '__getitem__'):
if dst.get(k) and type(v) == dict:
merge(v, dst.get(k))
else:
dst[k] = v
elif hasattr(dst, k) and type(v) == dict:
merge(v, getattr(dst, k))
else:
setattr(dst, k, v)
class User:
def __init__(self):
pass
class NotAccessibleClass: pass
not_accessible_variable = 'Hello'
merge({'__class__':{'__init__':{'__globals__':{'not_accessible_variable':'Polluted variable','NotAccessibleClass':{'__qualname__':'PollutedClass'}}}}}, User())
print(not_accessible_variable)
print(NotAccessibleClass)
#> Polluted variable
#> <class '__main__.PollutedClass'>
Kết
Đến đây các bạn đã có hiểu biết về loại lỗ hổng Class Pollution trong python này rồi. Trong phần tiếp theo của bài viết, tôi sẽ giới thiệu với các bạn một số case thực tế của lỗ hổng này và một số gadget thú vị. Chúc mừng năm mới 2023!
Link bài viết gốc: https://blog.abdulrah33m.com/prototype-pollution-in-python/
All Rights Reserved