Articles for tag: requests

Search on blog:

Scraping: How to download tgz file from eogauth.mines.edu.

It it problem from Stackoverflow.

The main problem was wrong url used in POST.

Often form sends data to the same url as page with form but it doesn't have to be true on all pages.

Form may send data to different url which can be defined as action in HTML <form action=...>

I use BeautifulSoup to get this information from HTML.

I don't have username and password to test all elements but at least now POST gets page with login form and message Invalid username or password. instead of page with message Invalid Request.

import requests
from bs4 import BeautifulSoup as BS

s = requests.Session()
#s.headers.update({'User-Agent': 'Mozilla/5.0'})

# --- use tgz to get login page -------

url_tgz = "https://eogdata.mines.edu/wwwdata/viirs_products/dnb_composites/v10//201707/vcmslcfg/SVDNB_npp_20170701-20170731_75N060W_vcmslcfg_v10_c201708061200.tgz"

r = s.get(url_tgz)
#print(r.status_code)
#print(r.history)
print('\n--- url page ---\n')
print(r.url)

# --- find url in form ---

soup = BS(r.text, 'html.parser')
item = soup.find('form')
url = item['action']

print('\n--- url form ---\n')
print(url)

print('\n--- url page == url page ---\n')
print( r.url == url )

# --- login ---

payload = {
    'username': 'salvandi69@gmail.com',
    'password': '123asdzxc',
    'credentialId': '',
}

r = s.post(url, data=payload)
#print(r.status_code)
#print(r.history)
#print(r.url)
#print(r.text)

# --- result ---

print('\n--- login ---\n')
soup = BS(r.text, 'html.parser')
item = soup.find('span', {'class': 'kc-feedback-text'})
if item:
    print('Message:', item.text)
else:
    print("Can't see error message")

print('\n--- end ---\n')

Notes:

Stackoverflow: Title

Scraping: Jak pobrać plik tgz ze strony eogauth.mines.edu.

Oto problem ze Stackoverflow.

Głównym problemem był zły url użyty w POST.

Często form wysyła dane to tego samego adresu jaki ma strona z tym formularze ale nie musi tak być na każdej stronie.

Formularz może wysyłać dane pod inny adres, który jest zdefiniowany jako action w HTML <form action …

read more | czytaj więcej

How to use DevTools in Firefox to find JSON data in EpicGames.com

Movie shows Devtools in Firefox, tab Network, filter XHR.

You can access DevTools using menu Web Developer or key shortcut F12.

After clicking link in DevTools it shows also tabs Headers and Response with JSON data.

Using context menu on link (right mouse click) you can also use Open In …

read more | czytaj więcej

Jak użyć DevTools w Firefox do szukania danych JSON na EpicGames.com

Film pokazuje Devtools w Firefox, zakłada Network, filtr XHR.

Można dostać się do DevTools używając menu Web Developer lub skrótu klawiszowego F12.

Po kliknięciu w link w DevTools pokazuje także boczne zakładki Headers i Response z danymi JSON.

Używając na linku menu kontektowego (prawy przycisk myszy) można także użyć Open …

read more | czytaj więcej

Python: How to use requests to send JSON data, POST data, args in url and files to server aiohttp.web

JSON data

requests uses json= to send JSON and it automatically convert dictionary and add header 'Content-Type': 'application/json'.

import requests

r = requests.post('http://0.0.0.0:8080/test', json={'param1': 'value1', 'param2': 'value2'})

The same with standard data= .

import requests
import json

r = requests.post('http://0 …

read more | czytaj więcej

Python: Jak użyć requests do wysłania danych JSON, danych POST, argumentów w url i plików do serwera aiohttp.web

Dane JSON

requests używa json= do wysyłania JSON i automatycznie zamienia na text i dodaje nagłówek 'Content-Type': 'application/json'.

import requests

r = requests.post('http://0.0.0.0:8080/test', json={'param1': 'value1', 'param2': 'value2'})

To samo z użyciem standardowego data= .

import requests
import json

r = requests.post('http …

read more | czytaj więcej

Python: Jak zapobiegać użyciu znaku procenta w url przez requests?

Jeśli potrzebujesz url z parametem podobnym do poniższego (z + i :)

    key=site:dummy+type:example+group:wheel

i użyjesz standardowej metody przekazywania parametrów w requests

    payload = {
        'key': 'site:dummy+type:example+group:wheel'
    }

    r = requests.get(url, params=payload)

to zostanie on przekonwetowany do postaci "bezpiecznej" dla przesyłu parametrów

    key …

read more | czytaj więcej

Python: How to use Tor Network with requests to change IP?

Tor Network can be used to run requests with changed IP.

If you have installed Tor then it should run all time as service and you could use it as proxy server with address 127.0.0.1:9050 (localhost:9050)

In requests you can use it

proxy = {
    'http':  'socks5 …

read more | czytaj więcej

Python: Jak użyć sieć Tor z requests ze zmienionym IP?

Sieć Tor może być użyta do uruchomienia requests ze zmienionym IP.

Jeśli masz już zainstalowany Tor wtedy powinien on chodzić cały czas jako usługa i powinna być możliwość użycia go jako proxy server z adresem 127.0.0.1:9050 (localhost:9050)

W requests możesz użyć

proxy = {
    'http':  'socks5://127 …

read more | czytaj więcej

Python: Dlaczego `requests` niepoprawnie dekoduje tekst zamiast użyć UTF-8

Czasami requests niepoprawnie dekoduje tekst w response.text - używa ISO-8859-1 (Latin-1) zamiast UTF-8 nawet jeśli w HTML jest <meta charset="uft-8"> lub <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">.

Można to zobaczyć w response.headers['content-type'] oraz response.encoding

Problem jest ponieważ on nie używa <meta> ale nagłówka Content-Type …

read more | czytaj więcej

Python: Why `requests` incorrectly decodes text instead of UTF-8

Sometimes requests incorrectly decodes text in response.text - it uses ISO-8859-1 (Latin-1) instead of UTF-8 event if there is <meta charset="uft-8"> or <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> in HTML.

Problem is it doesn't uses <meta> but header Content-Type which usually has value text/html; charset=UTF-8 …

read more | czytaj więcej

Python pomijanie encodowania pewnych znaków w urlencode()

Czasami API oczekuje pewnych wartości jako normalny tekst a nie zakodowany ale urlencode zamienia go. W takiej sytuacji można użyć safe="znaki" aby pominąć kodowanie dla tych znaków.

import urllib.parse

parameters = {'location': "22.303940,114.170372"}

print(urllib.parse.urlencode(parameters))
print(urllib.parse.urlencode(parameters, safe=','))

Wynik:

location …

read more | czytaj więcej

Python skip encoding some chars in urlencode()

Sometimes API expects some values as normal char, not encoded, but urlencode converts it. In this situation you can use safe="chars" to skip encoding these chars.

import urllib.parse

parameters = {'location': "22.303940,114.170372"}

print(urllib.parse.urlencode(parameters))
print(urllib.parse.urlencode(parameters, safe=','))

Result:

location=22 …

read more | czytaj więcej

Requests: use Imgur API to upload image[GB]

First you have to create normal account on Imgur.

After loging to normal account you can go to https://api.imgur.com/oauth2/addclient to register application.

It needs application name and email. Type of authorization depends on how you will use it.

You should get API keys

Which you …

read more | czytaj więcej

Requests: użycie Imgur API do załadowania zdjęcia

Najpierw trzeba założyć normalne konto na Imgur.

Po zalogowaniu na normalnym konice należy przejść do https://api.imgur.com/oauth2/addclient aby zarejestrować aplikację.

Wymagana jest nazwa i email. Typ autoryzacji zależy jak będzie wykorzystywana aplikacja.

Po rejestracji powinno podać klucze do API

Klucze API można wykorzystać do użycia API …

read more | czytaj więcej

How to use Requsts to send arguments in url, POST data, JSON data or file to Flask

This code will display different data from requests to show how flask get them.

from flask import Flask, request

app = Flask(__name__)

@app.route("/", methods=['GET', 'POST'])
def index():
    print('args:', request.args)
    print('form:', request.form)
    print('json:', request.json)
    print('data:', request.data)
    return ''

if __name__ == '__main__':
    app …

read more | czytaj więcej

Jak użyć Requsts do wysłania argumentów w url, danych POST, danych JSON lub pliku do Flask

Ten kod wyświetli różne dane przysłane z requests aby pokazać jak je odebrać we `flask``.

from flask import Flask, request

app = Flask(__name__)

@app.route("/", methods=['GET', 'POST'])
def index():
    print('args:', request.args)
    print('form:', request.form)
    print('json:', request.json)
    print('data:', request.data)
    return ''

if __name__ == '__main__ …

read more | czytaj więcej

Python: How to scrape aastocks.com with requests

It is example code to scrape it:

# date: 2019.09.16
# https://stackoverflow.com/questions/57861715/scrapy-infinite-scrolling-no-pagination-indication
# http://www.aastocks.com
import requests

newstime = '934735827'
newsid = 'HKEX-EPS-20190815-003587368'

url = 'http://www.aastocks.com/tc/resources/datafeed/getmorenews.ashx?cat=all&newstime={}&newsid={}&period=0&key=&symbol=00001'
url_artickle = "http://www.aastocks …

read more | czytaj więcej

Python: How to scrape allegro.pl with scrapy

It is example code to scrape it:

# date: 2017.12.10
# https://stackoverflow.com/a/47744135/1832058

import scrapy

#from allegro.items import AllegroItem

#class AllegroItem(scrapy.Item):
#    product_name = scrapy.Field()
#    product_sale_price = scrapy.Field()
#    product_seller = scrapy.Field()

class AllegroPrices(scrapy.Spider):

    name = "AllegroPrices"
    allowed_domains = ["allegro.pl"]

    start_urls = [
        "http://allegro.pl …

read more | czytaj więcej

Python: How to scrape alloschool.com with scrapy

It is example code to scrape it:

#!/usr/bin/env python3

# date: 2019.07.29
# https://stackoverflow.com/questions/57245315/using-scrapy-how-to-download-pdf-files-from-some-extracted-links

import scrapy

class MySpider(scrapy.Spider):

    name = 'myspider'

    start_urls = [
          'https://www.alloschool.com/course/alriadhiat-alaol-ibtdaii',
    ]

    def parse(self, response):

        for link in response.css('.default .er').xpath('@href').extract …

read more | czytaj więcej

« Page: 1 / 12 »