raena-crawler-engine/amazon_crawler_engine/test.py


from selenium import webdriver
from selenium.webdriver.common.by import By
import time

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

op = webdriver.ChromeOptions()
op.add_argument('--no-sandbox')
op.add_argument('--disable-notifications')
op.add_argument("--lang=en-GB")
#op.headless = True
driver=webdriver.Chrome( options=op)


driver.get('https://www.noon.com/uae-en/beauty/')

time.sleep(10)

element = driver.find_element(By.CSS_SELECTOR, '.componentArea-9')

title = element.find_element(By.CSS_SELECTOR, '.truncate-title-header').text
products = element.find_elements(By.CSS_SELECTOR, '.sc-kCMKrZ.ealOXE')

urls = []
for product in products:
    url = product.find_element(By.TAG_NAME, 'a').get_attribute('href')
    urls.append(url)

data = {
    "title": title,
    "products": urls
}

print(data)

driver.close()
first commit 2024-01-24 13:05:07 +00:00
			`from selenium import webdriver`
			`from selenium.webdriver.common.by import By`
			`import time`

			`import ssl`
			`ssl._create_default_https_context = ssl._create_unverified_context`

			`op = webdriver.ChromeOptions()`
			`op.add_argument('--no-sandbox')`
			`op.add_argument('--disable-notifications')`
			`op.add_argument("--lang=en-GB")`
			`#op.headless = True`
			`driver=webdriver.Chrome( options=op)`



			`driver.get('https://www.noon.com/uae-en/beauty/')`

			`time.sleep(10)`

			`element = driver.find_element(By.CSS_SELECTOR, '.componentArea-9')`

			`title = element.find_element(By.CSS_SELECTOR, '.truncate-title-header').text`
			`products = element.find_elements(By.CSS_SELECTOR, '.sc-kCMKrZ.ealOXE')`

			`urls = []`
			`for product in products:`
			`url = product.find_element(By.TAG_NAME, 'a').get_attribute('href')`
			`urls.append(url)`

			`data = {`
			`"title": title,`
			`"products": urls`
			`}`

			`print(data)`

			`driver.close()`