Работа с файлами типа json на python.

0

1

Как сделать , чтобы json.load(file) переводил не весь файл в объект, а определенное кол-во символов или определенное кол-во строк кода С КОНЦА?

Мне нужно по ключу вывести объект, только проблема в том, что у меня несколько одинаковых ключей в одном файле.

Вот пример файла:

{
«amount»: 2,
«hash»: «09fb1a1ec7fdd85386f728d7f4a19bcd»,
«name»: «ivan»,
«to_whom»: «katja»,
«uuid»: «7867857»
}

{
«amount»: 2,
«hash»: «39664a09322206aa658e9ab2cd5d63e4»,
«name»: «ivan»,
«to_whom»: «katja»,
«uuid»: «3242354»
}

Нужно напечатать, допустим, «uuid» последнего словаря.

P.s. Я новичок в программировании, поэтому, пожалуйста, не надо показывать какие вы умные. Если хотите помочь, то напишите как можно понятнее.

P.s. Была идея: прочитать и записать файл в переменную(пример: h), от этой переменной взять последние 163 символа(это размер словаря{}) (h[-163:]) и уже от этого найти json.loads(h)[«uuid»], но почему-то так не получилось.

Ссылка

←	Этапы сборки программы

Как вызвать exec* без утечки памяти?

→

Используй БД, например, sqlite и забудь уже про файлы.

vvn_black ★★★★★
(22.05.20 18:05:55 MSK)

Ссылка

Если хотите помочь, то напишите как можно понятнее.

Вариант помощи за вознаграждение рассматривается?

vvn_black ★★★★★
(22.05.20 18:09:19 MSK)

Ссылка

Твой файл – невалидный JSON. Поэтому напрямую с помощью json.load его не прочесть так, как тебе хочется. Можешь брать с конца файла по строке и ждать, пока не распарсится без ошибок. Модно, молодежно, неэффективно, вот это всё. А еще может на верхнем уровне сделать список из твоих объектов, тогда не будет проблем вытащить последний элемент стандартными средствами.

По символам: ты, возможно, не учел переводы строки. Это тоже символы.

lu4nik ★★★
(22.05.20 18:11:41 MSK)

Ссылка

1.После каждой '}' ставишь запятую.
2.Ставишь '[' в начале файла ']' в конце.
3.У тебя получается валидный json, парсишь его как обычно.
4.Берешь последний элемент массива.

от этой переменной взять последние 163 символа

Не надёжно.

P.s. Я новичок в программировании, поэтому, пожалуйста, не надо показывать какие вы умные.

Да да.

crutch_master ★★★★★
(22.05.20 18:20:48 MSK)

Был бы каждый объект записан в стоку, проблем бы не было, читал бы построчно и делал json.loads. А это ахинея какая-то, ни валидного JSON, ни адекватной записи.

Отформатируй пример файла нормально. Посмотрим, может быть, его хоть посплитить получится, если ты не контролируешь его содержимое.

Но лучше просто сделай валидный JSON или построчную запись объектов, в зависимости от потребностей.

~~WitcherGeralt~~ ★★
(22.05.20 18:30:44 MSK)
Последнее исправление: WitcherGeralt 22.05.20 18:31:17 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от crutch_master 22.05.20 18:20:48 MSK

Как это сделать если словари у меня создаются автоматически?

def create_block(name, amount, to_whom, ):

data = {
‘name’: name,
‘amount’: amount,
‘to_whom’: to_whom,
‘hash’: prev_hash,
‘uuid’: uuid_block
}
with open(blockchain_dir + filename, ‘w’) as file:
json.dump(data, file, indent=4, sort_keys=True, ensure_ascii=False)
Если здесь после словаря поставить «,», то он будет записан в файл так […] Как эти скобки ставить в начале и в конце файла я не знаю. И разделять словари «,» тож не знаю как.

lil_rainnn
(22.05.20 18:47:41 MSK) автор топика

Судя по формату можно либо взять последние несколько 7 строк или вообще распарсить руками.

В питоне и то и то просто.

AntonI ★★★★★
(22.05.20 18:50:08 MSK)

Ссылка

Ответ на: Как это сделать если словари у меня создаются автоматически? от lil_rainnn 22.05.20 18:47:41 MSK

прочитайте про разметку на ЛОРе

сначала формируйте список словарей, потом запишите список в файл.

AntonI ★★★★★
(22.05.20 18:52:31 MSK)

Ссылка

Ответ на: Как это сделать если словари у меня создаются автоматически? от lil_rainnn 22.05.20 18:47:41 MSK

indent=4[, sort_keys=True]

Убери эту ахинею, тогда сможешь читать построчно.

‘w’

Вот только как ты пишешь несколько объектов в файл, если у тебя файл открыт так, что он не должен дозаписываться? Ты, единожды открыв файл, за раз пишешь несколько объектов? Если да, то ты можешь просто сложить их в список и сериализовать уже его.

~~WitcherGeralt~~ ★★
(22.05.20 18:53:46 MSK)
Последнее исправление: WitcherGeralt 22.05.20 18:54:56 MSK (всего исправлений: 1)

Ответ на: Как это сделать если словари у меня создаются автоматически? от lil_rainnn 22.05.20 18:47:41 MSK

Как эти скобки ставить в начале и в конце файла я не знаю. И разделять словари «,» тож не знаю как.

Элементарно

cat file | tr -d "\n" | sed "s/}{/},{/g;s/^/[/;s/$/]/"

crutch_master ★★★★★
(22.05.20 19:15:13 MSK)

Ссылка

Два варианта на выбор: f(n) и g()

import json
import re

def f(n):
    'n - число строк с конца'
    with open('test.txt', 'r') as f: 
        return json.loads(' '.join(f.readlines()[:-n]))
    
def g():
    with open('test.txt', 'r') as f:
        return json.loads('[' + re.sub('}\s*{', '},{', f.read()) + ']')[-1]
    
print(f(8))
print(g())

Здесь не учитывается, что внутри json-строк могут быть фигурные скобки или символы начала строки, но, мне кажется, тебе это не важно. Если важно, напиши, я исправлю.

PS: Для корректной работы я заменил кавычки «» на " в файле. Не совсем понятно - это особенность разметки ЛОРа или твоего файла.

Marvel
(22.05.20 19:22:47 MSK)
Последнее исправление: Marvel 22.05.20 19:36:40 MSK (всего исправлений: 3)

Ответ на: комментарий от WitcherGeralt 22.05.20 18:53:46 MSK

У меня сделано так, если uuid какого-то файла совпадает с новым файлом, то в новый файл также записывается словарь из старого файла. Таким образом, у меня в 1 файл записываются 2-а словаря. При создании нового файла, опять идет сравнение uuid, вот здесь и выдается ошибка(потому что в файле 2- а словаря). И новый файл записывается только с новой информацией. Вот вся и проблема у меня, что он не дозаписывается.

lil_rainnn
(22.05.20 19:23:40 MSK) автор топика

Ссылка

на лоре есть разметка

abcq ★★
(22.05.20 20:35:04 MSK)

Ссылка

То что ты показал - это не JSON. Это могло быть двумя JSON’ами, но перестало быть таковым после склейки. Соответственно, JSON парсер парсить это вообще не должен. Решения:

Разделять обратно на json’ы руками. Например, если ты точно знаешь что объект занимает 7 строк, и \n ни в каких полях не встречается. Можно сразу с конца.
Не склеивать JSON’ы, а объединять в валидный JSON. Это будет выглядеть как-то так (кавычки лень заменять):

[
{
«amount»: 2,
«hash»: «09fb1a1ec7fdd85386f728d7f4a19bcd»,
«name»: «ivan»,
«to_whom»: «katja»,
«uuid»: «7867857»
}
,
{
«amount»: 2,
«hash»: «39664a09322206aa658e9ab2cd5d63e4»,
«name»: «ivan»,
«to_whom»: «katja»,
«uuid»: «3242354»
}
]

Писать свой парсер который умеет парсить конкатенацию json’ов
Взять готовый парсер который умеет конкатенированные json. YAJL умеет при указании соответствующего флага

последние 163 символа

Ты не знаешь что его размер 163 символа.

slovazap ★★★★★
(23.05.20 03:11:38 MSK)

Ссылка

Protobuf, avro и не долбаться с ручной сериализацией.

invy ★★★★★
(23.05.20 16:43:19 MSK)
Последнее исправление: invy 23.05.20 16:44:41 MSK (всего исправлений: 1)

Ссылка

Ответ на: комментарий от Marvel 22.05.20 19:22:47 MSK

      А как сделать, чтобы результат работы выводился в таком же виде, какой я приводил в примере?

lil_rainnn
(23.05.20 16:54:59 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Этапы сборки программы

Development

Как вызвать exec* без утечки памяти?

→

Как это сделать если словари у меня создаются автоматически?

Похожие темы